Extraire du texte d'un PowerPoint avec Java

Ce court tutoriel explique comment extraire du texte de PowerPoint avec Java. Il partagera les détails pour configurer l’IDE, une liste d’étapes, et un exemple de code pour développer un convertisseur PowerPoint en texte avec Java. Diverses options pour extraire le texte de la présentation seront abordées.

Étapes pour extraire tout le texte d’un PowerPoint avec Java

  1. Définissez l’environnement pour utiliser Aspose.Slides for Java afin de convertir PPTX en TXT
  2. Importez les dépendances pour l’analyse des diapositives et la sortie de fichiers.
  3. Chargez le fichier PPTX source en mémoire en utilisant la classe Presentation
  4. Récupérer tous les cadres de texte afin de collecter chaque conteneur de texte de tous les slides
  5. Parcourez tous les paragraphes et portions des cadres, et ajoutez le texte à l’objet StringBuilder.
  6. Enregistrez le fichier de sortie au format TXT

Les étapes susmentionnées résument le processus d’extraction de texte d’un PPTX avec Java. Chargez la présentation, accédez à toutes les zones de texte, créez un objet StringBuilder et parcourez toutes les zones pour récupérer les paragraphes. Pour chaque paragraphe, récupérez les portions, extrayez le texte de chaque portion et ajoutez‑le à l’instance StringBuilder, puis enregistrez enfin le texte accumulé dans un fichier TXT.

Code pour convertir un fichier PPTX en TXT avec Java

Ce code montre comment convertir PowerPoint en texte avec Java. Vous pouvez extraire le texte diapositive par diapositive en utilisant la méthode SlideUtil.getAllTextBoxes() qui prend une diapositive en entrée, extrait les notes du présentateur en utilisant la méthode slide.getNotesSlideManager().getNotesSlide(), et extraire le texte des tableaux en utilisant slide.getShapes() qui renvoie la collection de formes et filtre chaque forme qui est une instance de ITable. La sortie JSON peut également être générée en remplissant le JsonObject et en enregistrant les données dans un JSONArray.

Cet article explique le processus de conversion de PowerPoint en texte. Pour convertir une présentation en vidéo, consultez l’article Convertir PowerPoint en vidéo avec Java.

 Français