Koppelingen uit PDF extraheren met C#

Dit artikel geeft instructies over hoe u links uit PDF kunt extraheren met C#. Het bevat IDE-instellingen, stappen en een voorbeeldcode voor het ontwikkelen van een PDF-linkextractor met C#. U leert hoe u geselecteerde annotaties van een pagina kunt ophalen en hoe u URI’s van linktype-annotaties kunt ophalen.

Stappen om URL uit PDF te extraheren met C#

  1. Stel de IDE in om Aspose.PDF for .NET te gebruiken om URI uit een PDF-pagina te halen
  2. Laad de bron-PDF file en loop door alle pagina’s erin
  3. Maak een annotation selector om linkannotaties op een pagina te vinden
  4. Alle annotaties extraheren en de lijst met geselecteerde annotaties ophalen
  5. Loop door elke linkannotatie en vind bijbehorende acties
  6. Cast-actie naar een GoToURIAction om toegang te krijgen tot en URI weer te geven

Deze stappen beschrijven hoe u hyperlinks uit PDF kunt extraheren met C#. Maak een annotatieselector voor de linkannotaties en gebruik deze om een lijst met doelannotaties te selecteren. Typecast elke linkannotatie naar GoToURIAction en haal de URI van deze actie op.

De bovenstaande code laat zien hoe u alle links uit PDF kunt extraheren met C#. De AnnotationSelector neemt een LinkAnnotation-object dat het pagina- en rechthoekobject vereist. De Accept()-methode in de Page-klasse neemt het linkselectorobject en slaat de linkannotaties op in de Selected-collectie.

Deze snelle tutorial heeft ons het proces geleerd van het extraheren van hyperlinks uit een PDF-pagina. Om hyperlinks uit het PDF-bestand te verwijderen, raadpleeg het artikel Hoe verwijder je een hyperlink uit een PDF in C#.

 Nederlands