Hoe PDF-metadata te lezen met behulp van Python

In deze korte zelfstudie wordt uitgelegd hoe je PDF-metadata kunt lezen met Python. Het bevat gedetailleerde informatie om de omgeving in te stellen voor het ontwikkelen van de applicatie, een stapsgewijze procedure en een uitvoerbare voorbeeldcode voor het extraheren van metadata uit PDF met behulp van Python. Je leert hoe gemakkelijk het is om de applicatie te schrijven en toegang te krijgen tot de metadata-informatie van de PDF met zeer weinig API-aanroepen zonder een tool van derden te installeren in een van de door Python ondersteunde omgevingen.

Stappen om PDF-metadata te lezen met behulp van Python

  1. Stel de omgeving in voor gebruik Aspose.PDF voor Python via .NET om metadata te lezen
  2. Laad het PDF-bronbestand met het klasseobject Document om metadata op te halen
  3. Krijg toegang tot het DocumentInfo class-object dat de PDF-metadata bevat
  4. Krijg toegang tot enkele informatie-eigenschappen en geef ze weer op de console

Deze stappen beschrijven het proces om PDF-metadata te bekijken met Python. Eerst moet u het doel-PDF-bestand laden en vervolgens toegang krijgen tot de eigenschap DocumentInfo met de naam ‘Info’ in de klasse Document. Dit object heeft alle metadata in de PDF, zoals maker, wijzigingstijdzone, producent, aanmaakdatum en wijzigingsdatum.

Code om PDF-metadata te krijgen met behulp van Python

Deze code demonstreert simpelweg de procedure om PDF-metadata op te halen met behulp van Python. Het klasseobject DocumentInfo is toegankelijk vanuit het geladen document dat een aantal metadata-informatie bevat, zoals de gevangen vlag, titel, onderwerp, trefwoorden van het document en auteur. Als u deze eigenschappen wilt toevoegen, kunt u de methode DocumentInfo.add() gebruiken, de methode clear() gebruiken om de metagegevens te wissen en de methode remove() gebruiken om alleen de opgegeven metagegevens te verwijderen.

In dit artikel is het proces beschreven om metadata uit de pdf op te halen. Raadpleeg het artikel op hoe PDF-inhoud in Python te lezen als je het proces wilt leren om de PDF-inhoud te lezen.

 Nederlands