W tym krótkim artykule instruktażowym dowiesz się, jak wyodrębnić linki z PDF w Javie. Zawiera on ustawienia IDE, listę kroków i przykładowy kod do wyodrębnienia hiperlinków z PDF w Javie. Nauczysz się pobierać adnotacje typu linku i przekształcać je na URIAction w celu pobrania URI.
Kroki wyodrębniania adresu URL z pliku PDF w Javie
- Ustaw IDE tak, aby używało Aspose.PDF for Java do wyodrębniania linków
- Załaduj źródłowy plik PDF file, przejrzyj wszystkie strony i utwórz selektor adnotacji dla strony
- Wyodrębnij wszystkie adnotacje ze strony i zapisz je w wybranej kolekcji
- Przejrzyj wszystkie adnotacje i przekształć każdą adnotację w GoToURIAction
- Wywołaj metodę getURI(), aby uzyskać dostęp do łącza i wyświetlić je na konsoli
Ten przewodnik pokazuje, jak wyodrębnić wszystkie linki z pliku PDF w Javie. Załaduj źródłowy plik PDF, uzyskaj dostęp do stron docelowych i utwórz selektor adnotacji dla każdej strony. Wywołaj metodę accept() przy użyciu zdefiniowanego selektora, pobierz listę adnotacji linków i pobierz URI, rzutując go na klasę GoToURIAction.
Kod do wyodrębniania hiperłącza z pliku PDF w Javie
Powyższy kod zademonstrował ekstraktor linków PDF w Javie. Możesz pominąć lub wybrać stronę, analizując jej zawartość za pomocą obiektu klasy Page podczas iterowania po stronach w pliku PDF. Metoda getAction() służy do pobrania URIAction zawierającego URI linku.
W tym artykule poznaliśmy proces pobierania hiperłączy z pliku PDF. Aby utworzyć hiperłącza w pliku PDF, zapoznaj się z artykułem na temat jak utworzyć hiperłącze w pliku PDF za pomocą Java.