In diesem kurzen Anleitungsartikel erfahren Sie, wie Sie Links aus PDF in Java extrahieren. Er enthält die IDE-Einstellungen, eine Liste der Schritte und einen Beispielcode zum Extrahieren von Hyperlinks aus PDF in Java. Sie lernen, Linktyp-Anmerkungen abzurufen und sie zum Abrufen der URI in URIAction umzuwandeln.
Schritte zum Extrahieren einer URL aus einer PDF-Datei in Java
- Stellen Sie die IDE so ein, dass sie Aspose.PDF for Java zum Extrahieren von Links verwendet
- Laden Sie das Quell-PDF file, durchlaufen Sie alle Seiten und erstellen Sie einen Anmerkungsselektor für die Seite
- Extrahieren Sie alle Anmerkungen von der Seite und speichern Sie sie in der ausgewählten Sammlung.
- Iterieren Sie durch alle Anmerkungen und typisieren Sie jede Anmerkung in GoToURIAction
- Rufen Sie die Methode getURI() auf, um auf den Link zuzugreifen und ihn auf der Konsole anzuzeigen
In dieser Anleitung wird gezeigt, wie Sie alle Links aus PDF in Java extrahieren. Laden Sie die PDF-Quelldatei, greifen Sie auf die Zielseiten zu und erstellen Sie für jede Seite einen Annotation-Selektor. Rufen Sie die Methode accept() mit dem definierten Selektor auf, holen Sie sich die Liste der Link-Annotationen und holen Sie sich die URI, indem Sie sie in die Klasse GoToURIAction umwandeln.
Code zum Extrahieren von Hyperlinks aus PDF in Java
Der obige Code hat einen PDF-Link-Extraktor in Java demonstriert. Sie können eine Seite überspringen oder auswählen, indem Sie ihren Inhalt mithilfe des Page-Klassenobjekts analysieren, während Sie durch die Seiten im PDF iterieren. Die Methode getAction() wird verwendet, um die URIAction abzurufen, die die URI des Links enthält.
In diesem Artikel haben wir gelernt, wie man Hyperlinks aus einer PDF-Datei abruft. Informationen zum Erstellen von Hyperlinks in einer PDF-Datei finden Sie im Artikel zu So erstellen Sie mit Java einen Hyperlink in PDF.