Ten krótki samouczek wyjaśnia, jak wyodrębnić tekst z PowerPoint przy użyciu Javy. Przedstawi szczegóły dotyczące konfiguracji IDE, listę kroków oraz przykładowy kod do opracowania konwertera PowerPoint na tekst przy użyciu Javy. Omówione zostaną różne opcje wyodrębniania tekstu z prezentacji.
Kroki wyodrębniania całego tekstu z PowerPoint przy użyciu Javy
- Ustaw środowisko, aby używać Aspose.Slides for Java do konwersji PPTX na TXT
- Zaimportuj zależności do parsowania slajdów i zapisu pliku
- Załaduj plik PPTX źródłowy do pamięci, używając klasy Presentation
- Pobierz wszystkie ramki tekstowe, aby zebrać każdy kontener tekstowy ze wszystkich slides
- Przejdź przez wszystkie akapity i fragmenty ramek, a następnie dołącz tekst do obiektu StringBuilder.
- Zapisz plik wyjściowy jako plik TXT
Powyższe kroki podsumowują proces wyodrębniania tekstu z PPTX przy użyciu Javy. Załaduj prezentację, uzyskaj dostęp do wszystkich ramek tekstowych, utwórz obiekt StringBuilder i iteruj po wszystkich ramach, aby pobrać akapity. Z każdego akapitu pobierz fragmenty, wyodrębnij tekst z każdego fragmentu i dołącz go do instancji StringBuilder, a na końcu zapisz zgromadzony tekst do pliku TXT.
Kod konwertujący PPTX na TXT przy użyciu Javy
Ten kod demonstruje, jak przekształcić PowerPoint na tekst przy użyciu Javy. Możesz wyodrębniać tekst slajd po slajdzie, używając metody SlideUtil.getAllTextBoxes() przyjmująca slajd jako wejście oraz wyodrębniająca notatki prelegenta przy użyciu metody slide.getNotesSlideManager().getNotesSlide() i wyodrębniać tekst z tabel przy użyciu slajdu.getShapes() zwraca kolekcję kształtów i filtruje każdy kształt będący instancją ITable. Wyjście JSON można również wygenerować, wypełniając JsonObject i zapisując dane w JSONArray.
Ten artykuł wyjaśnia proces konwersji PowerPointa na tekst. Aby przekonwertować prezentację na wideo, odwołaj się do artykułu Konwertowanie PowerPointa na wideo przy użyciu Javy.