Text aus PowerPoint mit Java extrahieren

Dieses kurze Tutorial erklärt, wie man Text aus PowerPoint mit Java extrahiert. Es wird Details zur Einrichtung der IDE, eine Schritt‑für‑Schritt‑Liste und Beispielcode für die Entwicklung eines PowerPoint‑zu‑Text‑Konverters mit Java bereitstellen. Verschiedene Optionen zum Extrahieren von Text aus der Präsentation werden besprochen.

Schritte zum Extrahieren des gesamten Textes aus PowerPoint mit Java

  1. Setze die Umgebung so, dass Aspose.Slides for Java verwendet wird, um PPTX in TXT zu konvertieren.
  2. Importieren Sie die Abhängigkeiten für das Parsen von Folien und die Dateiausgabe
  3. Laden Sie die Quell‑PPTX‑Datei in den Speicher, indem Sie die Presentation Klasse verwenden.
  4. Rufen Sie alle Textrahmen ab, um jeden Textcontainer aus allen slides zu sammeln.
  5. Durchsuche alle Absätze und Abschnitte der Frames und füge den Text dem StringBuilder‑Objekt hinzu.
  6. Speichern Sie die Ausgabedatei als TXT-Datei

Die oben genannten Schritte fassen den Prozess zum Extrahieren von Text aus PPTX mit Java zusammen. Laden Sie die Präsentation, greifen Sie auf alle Textrahmen zu, erstellen Sie ein StringBuilder-Objekt und iterieren Sie durch alle Rahmen, um die Absätze abzurufen. Aus jedem Absatz holen Sie die Abschnitte, extrahieren den Text aus jedem Abschnitt und fügen ihn dem StringBuilder-Objekt hinzu, und speichern schließlich den gesammelten Text in einer TXT-Datei.

Code zum Konvertieren von PPTX in TXT mit Java

Dieser Code demonstriert, wie man PowerPoint in Text mit Java konvertiert. Sie können Text Folie für Folie extrahieren, indem Sie die Methode SlideUtil.Verwenden Sie getAllTextBoxes(), das eine Folie als Eingabe nimmt, und extrahieren Sie die Sprecher‑Notizen, indem Sie die Methode slide verwenden.getNotesSlideManager().Verwenden Sie getNotesSlide() und extrahieren Sie Text aus Tabellen, indem Sie slide verwenden.Verwenden Sie getShapes(), das die Shape‑Sammlung zurückgibt, und filtern Sie jede Shape, die eine Instanz von ITable ist. JSON‑Ausgabe kann ebenfalls erzeugt werden, indem Sie das JsonObject füllen und Daten in einem JSONArray speichern.

Dieser Artikel erklärt den Prozess, PowerPoint in Text zu konvertieren. Um eine Präsentation in ein Video zu konvertieren, siehe den Artikel PowerPoint in Video konvertieren mit Java.