Dieser kurze Leitfaden beschreibt, wie man Text aus PowerPoint mit Python extrahiert. Er enthält Details zur Einrichtung der IDE, eine Schritt‑für‑Schritt‑Liste und ein Beispielcode, um PowerPoint mit Python in Text zu konvertieren. Verschiedene Techniken werden diskutiert, um Text aus den Folien zu extrahieren.
Schritte zum Extrahieren von Text aus PPTX mit Python
- Stellen Sie die IDE so ein, dass sie Aspose.Slides for Python via .NET verwendet, um Text zu extrahieren.
- Importieren Sie die gewünschten Klassen aus der Bibliothek und die Hilfsklasse SlideUtil.
- Definieren Sie die Eingabe‑/Ausgabepfade und laden Sie die Lizenz
- Laden Sie die Quell‑PowerPoint‑Präsentation in das Presentation‑Objekt
- Verwenden Sie den SlideUtil.get_all_text_frames zum Extrahieren aller Textrahmen aus jeder Folie
- Durchsuche alle Textrahmen und deren Absätze, um einzelne Textabschnitte zu sammeln.
- Verarbeite jedes Frame und füge die Folieninhalte in einer neuen Zeile an.
- Speichere alle gesammelten Textabschnitte und speichere die Ausgabe in einer TXT-Datei
Diese Schritte erklären den Prozess zur Entwicklung eines PPTX-zu-Text-Konverters mit Python. Laden Sie die Präsentation, holen Sie alle Textrahmen daraus, analysieren Sie jeden Absatz in allen Rahmen und extrahieren Sie den Text aus den Abschnitten. Speichern Sie alle gesammelten Daten in einer Textdatei mit einem Zeilenseparator für jedes Textsegment.
Code für einen PowerPoint‑zu‑Text‑Konverter mit Python.
Dieser Code zeigt, wie man PPTX in TXT mit Python konvertiert. Anstatt die gesamte Präsentation auf einmal zu scannen, können Sie jede Folie einzeln abrufen und verarbeiten, um Text nur von den ausgewählten Folien zu erhalten. Eine weitere Option ist, die Präsentation nicht in den Speicher zu laden, sondern nur den Dateipfad zu verwenden, um den Text mit einem Flag zu extrahieren, das den Text in der angeordneten Reihenfolge, als Original oder in flacher Reihenfolge, abruft.
Dieser kurze Artikel erklärt, wie man Text aus einer PPTX extrahiert. Um eine Präsentation in ein Video zu konvertieren, siehe den Artikel PowerPoint mit Python in ein Video konvertieren.