Extraire les liens d'un PDF à l'aide de C#

Cet article explique comment extraire des liens de PDF à l’aide de C#. Il contient des paramètres IDE, des étapes et un exemple de code pour développer un extracteur de liens PDF à l’aide de C#. Vous apprendrez à récupérer les annotations sélectionnées à partir d’une page et à récupérer l’URI à partir des annotations de type lien.

Étapes pour extraire l’URL d’un PDF à l’aide de C#

  1. Configurer l’IDE pour utiliser Aspose.PDF for .NET pour extraire l’URI d’une page PDF
  2. Chargez le PDF source file et parcourez toutes les pages qu’il contient
  3. Créez un annotation selector pour rechercher des annotations de lien sur une page
  4. Extraire toutes les annotations et récupérer la liste des annotations sélectionnées
  5. Parcourez chaque annotation de lien et recherchez les actions associées
  6. Lancez une action sur une GoToURIAction pour accéder et afficher l’URI

Ces étapes décrivent comment extraire des hyperliens d’un PDF à l’aide de C#. Créez un sélecteur d’annotations pour les annotations de lien et utilisez-le pour sélectionner une liste d’annotations cibles. Convertissez chaque annotation de lien en GoToURIAction et récupérez l’URI à partir de cette action.

Code pour extraire un lien hypertexte d’un PDF à l’aide de C#

Le code ci-dessus montre comment extraire tous les liens d’un PDF à l’aide de C#. AnnotationSelector prend un objet LinkAnnotation qui nécessite l’objet page et rectangle. La méthode Accept() de la classe Page prend l’objet sélecteur de liens et enregistre les annotations de liens dans la collection Selected.

Ce tutoriel rapide nous a montré le processus d’extraction des hyperliens d’une page PDF. Pour supprimer les hyperliens du fichier PDF, reportez-vous à l’article Comment supprimer un lien hypertexte d’un PDF en C#.

 Français