Ovaj kratki tutorial objašnjava kako izvući tekst iz PowerPoint koristeći Java. Podijelit će detalje o postavljanju IDE-a, popis koraka i uzorak koda za razvoj pretvarača iz PowerPointa u tekst koristeći Javu. Razgovarat će se o raznim opcijama za izvlačenje teksta iz prezentacije.
Koraci za izdvajanje cijelog teksta iz PowerPointa pomoću Jave
- Postavite okruženje da koristi Aspose.Slides for Java za pretvaranje PPTX u TXT
- Uvezite ovisnosti za parsiranje slajdova i izlaz u datoteku
- Učitaj izvorni PPTX datoteku u memoriju koristeći klasu Presentation
- Dohvatite sve okvire teksta kako biste prikupili svaki kontejner teksta iz svih slides
- Prođite kroz sve paragrafe i dijelove okvira te dodajte tekst u objekt StringBuilder
- Spremi izlaznu datoteku kao TXT datoteku
Gore navedeni koraci sažimaju proces ekstrakcije teksta iz PPTX‑a pomoću Jave. Učitajte prezentaciju, pristupite svim tekstualnim okvirima, kreirajte objekt StringBuilder i iterirajte kroz sve okvire kako biste dohvatili odlomke. Iz svakog odlomka dohvatite dijelove, ekstrahirajte tekst iz svakog dijela i dodajte ga u instancu StringBuildera, te na kraju spremite akumulirani tekst u TXT datoteku.
Kod za pretvaranje PPTX u TXT pomoću Jave
Ovaj kod demonstrira kako pretvoriti PowerPoint u tekst koristeći Javu. Možete izvući tekst slajd po slajd koristeći metodu SlideUtil.getAllTextBoxes() koja prima slajd kao ulaz i izvuče bilješke govornika koristeći metodu slide.getNotesSlideManager().getNotesSlide(), te izvući tekst iz tablica koristeći slide.getShapes() koji vraća kolekciju oblika i filtrira svaki oblik koji je instanca ITable. JSON izlaz također se može generirati popunjavanjem JsonObject i spremanjem podataka u JSONArray.
Ovaj članak objašnjava postupak pretvaranja PowerPointa u tekst. Za pretvaranje prezentacije u video, pogledajte članak Pretvorite PowerPoint u video pomoću Jave.