Deze korte zelfstudie begeleidt u bij hoe u tekst kunt doorhalen in Adobe PDF met behulp van Python. Het deelt alle noodzakelijke stappen om de omgeving tot stand te brengen en een lijst met te volgen stappen, samen met de uitvoerbare voorbeeldcode die demonstreert hoe je met Python kunt doorbreken in Adobe Acrobat. U leert het proces om de applicatie helemaal opnieuw te ontwikkelen met behulp van een paar API-aanroepen, samen met de beschrijving van alle stappen.
Stappen om tekst in Adobe PDF door te halen met behulp van Python
- Stel de IDE in op gebruik Aspose.PDF voor Python via .NET om de tekst door te halen
- Laad het PDF-bronbestand waar tekst moet worden doorgehaald met behulp van het klasseobject Document
- Definieer het zoekwoord in de PDF met behulp van het klasseobject TextFragmentAbsorber
- Voer de methode visit() uit op de doelpagina om de instanties van het doelwoord te doorzoeken
- Maak een StrikeOutAnnotation-object met behulp van het rechthoekige gebied van de eerste instantie van het gezochte woord
- Stel de kleur en titel van de doorgestreepte annotatie in voordat u deze toevoegt aan de annotatieverzameling van de pagina
- Sla het resulterende PDF-bestand op met doorhaling bij de eerste keer dat het gewenste woord voorkomt
Deze stappen definiëren het proces van hoe tekst in PDF door te halen met behulp van Python. Het vereist het laden van het doel-PDF-bestand en vervolgens zoeken naar de exemplaren van het gewenste woord dat op een bepaalde pagina moet worden doorgestreept. Nadat het zoeken is voltooid, wordt het rechthoekige gebied van de eerste instantie gebruikt om een StrikeOutAnnotation-object te instantiëren dat daadwerkelijk een doorstreeplijn op de tekst met de gewenste kleur en de titel indien nodig zal maken.
Code om tekst in PDF door te halen met behulp van Python
Dit voorbeeldstukje code kan worden gebruikt als basis voor een volledige toepassing om door te halen in Adobe Acrobat met behulp van Python. Gebruik de klasse TextFragmentAbsorber om het doelwoord op een bepaalde pagina te doorzoeken om de lijst te krijgen met alle keren dat dat woord voorkomt. In de volgende stap moet u een StrikeOutAnnotation-object maken binnen het rechthoekige gebied van de doeloccurrence, zodat de lijn wordt weergegeven binnen die omringende rechthoek.
Deze korte handleiding heeft ons geleerd om doorstreepte lijnen weer te geven op een of meer woorden op een PDF-pagina. Als je het proces wilt leren om een tabel in een pdf in te voegen, raadpleeg dan het artikel op hoe een tabel in PDF in te voegen met behulp van Python.