Extrahujte odkazy z PDF pomocí C#

Tento článek popisuje, jak extrahovat odkazy z PDF pomocí C#. Obsahuje nastavení IDE, kroky a ukázkový kód pro vývoj PDF link extractor pomocí C#. Naučíte se načíst vybrané anotace ze stránky a načíst URI z anotací typu odkazu.

Kroky k extrahování URL z PDF pomocí C#

  1. Nastavte IDE na použití Aspose.PDF for .NET k extrahování URI ze stránky PDF
  2. Načtěte zdrojové PDF file a procházejte všechny stránky v něm
  3. Vytvořte annotation selector pro vyhledání anotací odkazů na stránce
  4. Extrahujte všechny anotace a načtěte seznam vybraných anotací
  5. Procházejte každou anotaci odkazu a vyhledejte související akce
  6. Odeslání akce do akce GoToURIA pro přístup a zobrazení URI

Tyto kroky popisují, jak extrahovat hypertextové odkazy z PDF pomocí C#. Vytvořte selektor anotací pro anotace odkazů a použijte jej k výběru seznamu cílových anotací. Přetypujte každou anotaci odkazu do akce GoTOURIA a načtěte URI z této akce.

Kód pro extrahování hypertextového odkazu z PDF pomocí C#

Výše uvedený kód ukazuje, jak extrahovat všechny odkazy z PDF pomocí C#. AnnotationSelector přebírá objekt LinkAnnotation, který vyžaduje objekt stránky a obdélníku. Metoda Accept() ve třídě Page přebírá objekt selektoru odkazů a ukládá anotace odkazů do kolekce Selected.

Tento rychlý tutoriál nás naučil proces extrahování hypertextových odkazů ze stránky PDF. Chcete-li odstranit hypertextové odkazy ze souboru PDF, přečtěte si článek Jak odstranit hypertextový odkaz z PDF v C#.

 Čeština