Extraire du texte d'un PowerPoint avec C#

Ce guide rapide décrit comment extraire du texte de PowerPoint à l’aide de C#. Il comprend des détails pour configurer l’IDE, une liste d’étapes, et un exemple de code pour développer un PowerPoint vers convertisseur de texte en C#. Vous apprendrez à accéder à divers contenus dans la présentation/diapositives pour en extraire le texte.

Étapes pour convertir PowerPoint en texte avec C#

  1. Configurez l’environnement pour utiliser Aspose.Slides for .NET afin de convertir les fichiers PPTX en TXT
  2. Ouvrez le fichier PPTX en mémoire en utilisant la classe Presentation, en utilisant le chemin d’accès du fichier d’entrée défini.
  3. Appelez la méthode SlideUtil.GetAllTextFrames() pour extraire toutes les zones de texte de chaque diapositive
  4. Définissez le drapeau pour extraire également les zones de texte des diapositives maîtres et de mise en page.
  5. Déclarez l’objet StringBuilder pour contenir le texte extrait
  6. Analyser chaque trame de texte et accéder à ses paragraphes
  7. Parcourez chaque paragraphe et ajoutez ses parties de texte sur de nouvelles lignes dans le StringBuilder.
  8. Écrivez le texte accumulé final dans un fichier TXT sur le disque

Ces étapes expliquent le développement du convertisseur PPTX en texte utilisant C#. Chargez la présentation, récupérez la collection de toutes les zones de texte, créez un objet StringBuilder et parcourez chaque zone de la collection. Pour chaque zone, accédez à la collection de paragraphes, dans chaque paragraphe, obtenez la collection des portions, récupérez le texte de la portion et ajoutez‑le à l’objet StringBuilder.

Code pour convertir un PPTX en TXT avec C#

Ce code montre comment extraire du texte d’un PPTX avec C#. Il existe une autre méthode rapide pour récupérer le texte de l’ensemble de la présentation en utilisant PresentationFactory.Instance. La méthode ObtenirTexteDePrésentation(cheminEntrée, ModeDispositionExtractionTexte)Non organisé) écrit le contenu de chaque diapositive dans un fichier de sortie encodé en UTF‑8. Quatre composants textuels seront écrits pour chaque diapositive, incluant le texte principal, les notes du présentateur, le texte de la diapositive maître et le texte de la mise en page.

Cet article nous a montré comment extraire tout le texte d’une présentation. Pour convertir un PowerPoint en vidéo MP4, consultez l’article Convertir PowerPoint en vidéo avec C#.

 Français