Ce guide rapide explique comment extraire un tableau de PDF à Excel en utilisant Java. Vous obtiendrez les informations pour configurer l’environnement, une liste d’étapes et un exemple de code pour extraire un tableau d’un PDF vers Excel en Java. Tous les détails nécessaires sont présentés pour accéder à chaque tableau sur n’importe quelle page PDF, récupérer le texte de toutes les cellules et copier le contenu dans la cellule correspondante du classeur de sortie.
Étapes pour extraire un tableau d’un PDF vers Excel en Java
- Configurer l’environnement pour utiliser Aspose.Total for Java afin d’extraire le tableau PDF dans la feuille Excel
- Appliquer la licence Aspose.Total pour les produits Aspose.PDF et Aspose.Cells
- Chargez le fichier PDF source dans l’objet de classe Document
- Créez un fichier Excel vide en utilisant la classe Workbook d’Aspose.Cells
- Parcourez chaque page du PDF et accédez à la collection de tables sur chaque page
- Parcourez toutes les pages et accédez à chaque cellule une par une
- Récupérer le texte de chaque cellule et enregistrer le contenu dans la ligne et la colonne respectives de la feuille de destination
- Ajustez automatiquement la largeur des colonnes dans la feuille et enregistrez le fichier Excel de sortie
Suivez ces étapes pour obtenir le tableau du PDF vers Excel en Java. Commencez le processus en chargeant le fichier PDF source, en accédant à toutes ses pages, en analysant chaque page séparément, en récupérant la collection de tableaux sur chaque page, et en accédant à chaque cellule du tableau sélectionné. Combinez le texte d’une cellule en chaîne et enregistrez le contenu dans la ligne et la colonne correspondantes sur la feuille particulière du fichier Excel de sortie.
Code pour extraire un tableau Excel d’un PDF avec Java
Ce code montre comment extraire des données d’un tableau PDF vers Excel en Java. Le format de texte du PDF source peut être appliqué au tableau de la feuille Excel en récupérant la couleur des cellules du tableau PDF, le style gras/italique, le nom et la taille de la police, et en appliquant les mêmes paramètres à la cellule Excel lors de l’écriture du contenu. Faites attention lors de la gestion des tableaux fusionnés dans le PDF et de leur création dans le fichier Excel afin de conserver la même organisation du contenu du tableau.
Cet article explique le processus de copie de texte d’un tableau PDF vers un tableau Excel. Pour convertir un PDF numérisé en PDF modifiable, consultez l’article Convertir un PDF numérisé en PDF modifiable avec Java.