Tento článek popisuje, jak extrahovat odkazy z PDF pomocí C#. Obsahuje nastavení IDE, kroky a ukázkový kód pro vývoj PDF link extractor pomocí C#. Naučíte se načíst vybrané anotace ze stránky a načíst URI z anotací typu odkazu.
Kroky k extrahování URL z PDF pomocí C#
- Nastavte IDE na použití Aspose.PDF for .NET k extrahování URI ze stránky PDF
- Načtěte zdrojové PDF file a procházejte všechny stránky v něm
- Vytvořte annotation selector pro vyhledání anotací odkazů na stránce
- Extrahujte všechny anotace a načtěte seznam vybraných anotací
- Procházejte každou anotaci odkazu a vyhledejte související akce
- Odeslání akce do akce GoToURIA pro přístup a zobrazení URI
Tyto kroky popisují, jak extrahovat hypertextové odkazy z PDF pomocí C#. Vytvořte selektor anotací pro anotace odkazů a použijte jej k výběru seznamu cílových anotací. Přetypujte každou anotaci odkazu do akce GoTOURIA a načtěte URI z této akce.
Kód pro extrahování hypertextového odkazu z PDF pomocí C#
Výše uvedený kód ukazuje, jak extrahovat všechny odkazy z PDF pomocí C#. AnnotationSelector přebírá objekt LinkAnnotation, který vyžaduje objekt stránky a obdélníku. Metoda Accept() ve třídě Page přebírá objekt selektoru odkazů a ukládá anotace odkazů do kolekce Selected.
Tento rychlý tutoriál nás naučil proces extrahování hypertextových odkazů ze stránky PDF. Chcete-li odstranit hypertextové odkazy ze souboru PDF, přečtěte si článek Jak odstranit hypertextový odkaz z PDF v C#.