Deze korte tutorial legt uit hoe je tekst uit PowerPoint met Java kunt extraheren. Het zal details delen over het instellen van de IDE, een lijst met stappen, en een voorbeeldcode voor het ontwikkelen van een PowerPoint-naar-tekst converter met Java. Diverse opties voor het extraheren van tekst uit de presentatie worden besproken.
Stappen om alle tekst uit PowerPoint te extraheren met Java
- Stel de omgeving in om Aspose.Slides for Java te gebruiken om PPTX naar TXT te converteren
- Importeer de afhankelijkheden voor het parseren van dia’s en bestandsoutput
- Laad het bron‑PPTX‑bestand in het geheugen door de Presentation‑klasse te gebruiken.
- Haal alle tekstframes op om elke tekstcontainer van alle slides te verzamelen
- Doorloop alle alinea’s en delen van de frames en voeg tekst toe aan het StringBuilder‑object
- Sla het uitvoerbestand op als een TXT‑bestand
De hierboven genoemde stappen vatten het proces samen om tekst uit PPTX te extraheren met Java. Laad de presentatie, krijg toegang tot alle tekstframes, maak een StringBuilder‑object aan en doorloop alle frames om de alinea’s op te halen. Haal van elke alinea de delen op, extraheer de tekst uit elk deel en voeg deze toe aan de StringBuilder‑instantie, en sla tenslotte de verzamelde tekst op in een TXT‑bestand.
Code om PPTX naar TXT te converteren met Java
Deze code toont hoe je PowerPoint naar tekst kunt converteren met Java. Je kunt tekst dia voor dia extraheren met de SlideUtil.getAllTextBoxes()-methode die een dia als invoer neemt en sprekersnotities uit de dia extraheert.getNotesSlideManager().getNotesSlide()-methode en tekst uit tabellen extraheren met slide.getShapes() die de shapes-collectie retourneert en elke shape filtert die een instantie van ITable is. JSON-uitvoer kan ook worden gegenereerd door het JsonObject in te vullen en gegevens op te slaan in een JSONArray.
Dit artikel legt het proces uit om PowerPoint naar tekst te converteren. Om een presentatie naar video te converteren, raadpleeg het artikel PowerPoint naar video converteren met Java.