Izvuci tekst iz PowerPointa pomoću Jave

Ovaj kratki tutorial objašnjava kako izvući tekst iz PowerPoint koristeći Java. Podijelit će detalje o postavljanju IDE-a, popis koraka i uzorak koda za razvoj pretvarača iz PowerPointa u tekst koristeći Javu. Razgovarat će se o raznim opcijama za izvlačenje teksta iz prezentacije.

Koraci za izdvajanje cijelog teksta iz PowerPointa pomoću Jave

  1. Postavite okruženje da koristi Aspose.Slides for Java za pretvaranje PPTX u TXT
  2. Uvezite ovisnosti za parsiranje slajdova i izlaz u datoteku
  3. Učitaj izvorni PPTX datoteku u memoriju koristeći klasu Presentation
  4. Dohvatite sve okvire teksta kako biste prikupili svaki kontejner teksta iz svih slides
  5. Prođite kroz sve paragrafe i dijelove okvira te dodajte tekst u objekt StringBuilder
  6. Spremi izlaznu datoteku kao TXT datoteku

Gore navedeni koraci sažimaju proces ekstrakcije teksta iz PPTX‑a pomoću Jave. Učitajte prezentaciju, pristupite svim tekstualnim okvirima, kreirajte objekt StringBuilder i iterirajte kroz sve okvire kako biste dohvatili odlomke. Iz svakog odlomka dohvatite dijelove, ekstrahirajte tekst iz svakog dijela i dodajte ga u instancu StringBuildera, te na kraju spremite akumulirani tekst u TXT datoteku.

Kod za pretvaranje PPTX u TXT pomoću Jave

Ovaj kod demonstrira kako pretvoriti PowerPoint u tekst koristeći Javu. Možete izvući tekst slajd po slajd koristeći metodu SlideUtil.getAllTextBoxes() koja prima slajd kao ulaz i izvuče bilješke govornika koristeći metodu slide.getNotesSlideManager().getNotesSlide(), te izvući tekst iz tablica koristeći slide.getShapes() koji vraća kolekciju oblika i filtrira svaki oblik koji je instanca ITable. JSON izlaz također se može generirati popunjavanjem JsonObject i spremanjem podataka u JSONArray.

Ovaj članak objašnjava postupak pretvaranja PowerPointa u tekst. Za pretvaranje prezentacije u video, pogledajte članak Pretvorite PowerPoint u video pomoću Jave.

 Hrvatski