Extrair links de PDF usando C#

Este artigo orienta sobre como extrair links de PDF usando C#. Ele tem configurações de IDE, etapas e um código de exemplo para desenvolver um extrator de link PDF usando C#. Você aprenderá a recuperar anotações selecionadas de uma página e buscar URI de anotações do tipo link.

Etapas para extrair URL de PDF usando C#

  1. Defina o IDE para usar Aspose.PDF for .NET para extrair URI de uma página PDF
  2. Carregue o PDF de origem file e faça um loop por todas as páginas nele contidas
  3. Crie um annotation selector para encontrar anotações de link em uma página
  4. Extraia todas as anotações e recupere a lista de anotações selecionadas
  5. Iterar por cada anotação de link e encontrar ações associadas
  6. Ação de transmissão para um GoToURIAction para acessar e exibir URI

Estas etapas descrevem como extrair hiperlinks de PDF usando C#. Crie um seletor de anotação para as anotações de link e use-o para selecionar uma lista de anotações de destino. Typecast cada anotação de link para GoToURIAction e busque o URI dessa ação.

O código acima demonstra como extrair todos os links de PDF usando C#. O AnnotationSelector pega um objeto LinkAnnotation que requer a página e o objeto retângulo. O método Accept() na classe Page pega o objeto seletor de link e salva as anotações de link na coleção Selected.

Este tutorial rápido nos ensinou o processo de extração de hyperlinks de uma página PDF. Para remover hyperlinks do arquivo PDF, consulte o artigo Como remover hiperlink de PDF em C#.

 Português