Тази статия ръководи как да извличате връзки от PDF с помощта на C#. Той има IDE настройки, стъпки и примерен код за разработване на PDF екстрактор на връзки с помощта на C#. Ще се научите да извличате избрани анотации от страница и да извличате URI от анотации от тип връзка.
Стъпки за извличане на URL от PDF с помощта на C#
- Настройте IDE да използва Aspose.PDF for .NET за извличане на URI от PDF страница
- Заредете изходния PDF file и прегледайте всички страници в него
- Създайте annotation selector за намиране на анотации за връзки на страница
- Извлечете всички анотации и извлечете списъка с избрани анотации
- Прегледайте всяка анотация на връзката и намерете свързани действия
- Прехвърляне на действие към GoToURIAction за достъп и показване на URI
Тези стъпки описват как да извлечете хипервръзки от PDF с помощта на C#. Създайте селектор на анотации за анотациите на връзката и го използвайте, за да изберете списък с целеви анотации. Типизирайте всяка анотация за връзка към GoToURIAction и извличайте URI от това действие.
Код за извличане на хипервръзка от PDF с помощта на C#
Кодът по-горе демонстрира как да извлечете всички връзки от PDF с помощта на C#. AnnotationSelector приема обект LinkAnnotation, който изисква обекта страница и правоъгълник. Методът Accept() в класа Page взема обекта за избор на връзка и записва анотациите на връзката в колекцията Selected.
Този бърз урок ни научи на процеса на извличане на хипервръзки от PDF страница. За да премахнете хипервръзки от PDF файла, вижте статията Как да премахнете хипервръзка от PDF в C#.