Wyodrębnij linki z pliku PDF za pomocą języka C#

W tym artykule znajdziesz wskazówki, jak wyodrębnić linki z PDF przy użyciu języka C#. Zawiera ustawienia IDE, kroki i przykładowy kod do opracowania ekstraktora linków PDF przy użyciu języka C#. Nauczysz się pobierać wybrane adnotacje ze strony i pobierać URI z adnotacji typu link.

Kroki wyodrębniania adresu URL z pliku PDF za pomocą języka C#

  1. Ustaw IDE tak, aby używało Aspose.PDF for .NET do wyodrębniania URI ze strony PDF
  2. Załaduj źródłowy plik PDF file i przejrzyj wszystkie jego strony
  3. Utwórz annotation selector, aby znaleźć adnotacje linków na stronie
  4. Wyodrębnij wszystkie adnotacje i pobierz listę wybranych adnotacji
  5. Przejrzyj każdą adnotację łącza i znajdź powiązane działania
  6. Prześlij akcję do GoToURIAction, aby uzyskać dostęp do URI i wyświetlić go

Te kroki opisują, jak wyodrębnić hiperłącza z pliku PDF za pomocą języka C#. Utwórz selektor adnotacji dla adnotacji linków i użyj go, aby wybrać listę adnotacji docelowych. Rzutuj typ każdej adnotacji linku na GoToURIAction i pobierz URI z tej akcji.

Kod do wyodrębniania hiperłącza z pliku PDF za pomocą języka C#

Powyższy kod pokazuje, jak wyodrębnić wszystkie linki z pliku PDF za pomocą języka C#. AnnotationSelector przyjmuje obiekt LinkAnnotation, który wymaga obiektu page i rectangle. Metoda Accept() w klasie Page przyjmuje obiekt link selector i zapisuje adnotacje linków w kolekcji Selected.

Ten szybki samouczek nauczył nas procesu wyodrębniania hiperłączy ze strony PDF. Aby usunąć hiperłącza z pliku PDF, zapoznaj się z artykułem Jak usunąć hiperłącze z pliku PDF w C#.

 Polski