Този бърз урок обяснява как да четете PDF метаданни с помощта на Python. Той съдържа подробна информация за настройка на средата за разработване на приложението, поетапна процедура и изпълним примерен код за извличане на метаданни от PDF с помощта на Python. Ще научите колко лесно е да напишете приложението и да получите достъп до информацията за метаданни от PDF, като използвате много малко API извиквания, без да инсталирате инструмент на трета страна в някоя от поддържаните от Python среди.
Стъпки за четене на PDF метаданни с помощта на Python
- Създайте среда за използвайте Aspose.PDF за Python чрез .NET за четене на метаданни
- Заредете изходния PDF файл, като използвате обекта на клас Document, за да извлечете метаданни
- Получете достъп до обекта на класа DocumentInfo, съдържащ PDF метаданните
- Осъществете достъп до няколко информационни свойства и ги покажете на конзолата
Тези стъпки описват процеса за преглед на PDF метаданни с помощта на Python. Първо трябва да заредите целевия PDF файл и след това да получите достъп до свойството DocumentInfo, наречено Info в класа Document. Този обект има всички метаданни в PDF файла като създател, часова зона на модификация, производител, дата на създаване и дата на модификация.
Код за получаване на PDF метаданни с помощта на Python
Този код просто демонстрира процедурата за извличане на PDF метаданни с помощта на Python. Обектът на класа DocumentInfo е достъпен от заредения документ, който има редица информация за метаданни, като прихванат флаг, заглавие, тема, ключови думи на документа и автор. Ако искате да добавите тези свойства, можете да използвате метода DocumentInfo.add(), да използвате метода clear(), за да изчистите метаданните, и да използвате метода remove(), за да премахнете само определени метаданни.
Тази статия описва процеса за извличане на метаданни от PDF. Ако искате да научите процеса за четене на съдържанието на PDF, вижте статията на как да четете PDF съдържание в Python.