Questo articolo spiega come estrarre link da PDF usando C#. Contiene impostazioni IDE, passaggi e un codice di esempio per sviluppare un estrattore di link PDF usando C#. Imparerai a recuperare annotazioni selezionate da una pagina e a recuperare URI da annotazioni di tipo link.
Passaggi per estrarre l’URL dal PDF utilizzando C#
- Imposta l’IDE per utilizzare Aspose.PDF for .NET per estrarre l’URI da una pagina PDF
- Carica il PDF sorgente file e scorri tutte le pagine in esso contenute
- Crea un annotation selector per trovare annotazioni di collegamento su una pagina
- Estrarre tutte le annotazioni e recuperare l’elenco delle annotazioni selezionate
- Scorrere ogni annotazione del collegamento e trovare le azioni associate
- Trasmetti l’azione a un GoToURIAction per accedere e visualizzare l’URI
Questi passaggi descrivono come estrarre hyperlink da PDF usando C#. Crea un selettore di annotazioni per le annotazioni di link e usalo per selezionare un elenco di annotazioni di destinazione. Converti ogni annotazione di link in GoToURIAction e recupera l’URI da questa azione.
Codice per estrarre l’hyperlink dal PDF usando C#
Il codice sopra mostra come estrarre tutti i link da PDF usando C#. AnnotationSelector accetta un oggetto LinkAnnotation che richiede l’oggetto page e rectangular. Il metodo Accept() nella classe Page accetta l’oggetto link selector e salva le annotazioni dei link nella collection Selected.
Questo rapido tutorial ci ha insegnato il processo di estrazione degli hyperlink da una pagina PDF. Per rimuovere gli hyperlink dal file PDF, fare riferimento all’articolo Come rimuovere l’hyperlink dal PDF in C#.