Витягнути текст з PowerPoint за допомогою Java

Цей короткий посібник пояснює, як вилучити текст з PowerPoint за допомогою Java. Він надасть деталі щодо налаштування IDE, список кроків та зразковий код для розробки конвертера PowerPoint у текст за допомогою Java. Будуть розглянуті різні варіанти вилучення тексту з презентації.

Кроки для вилучення всього тексту з PowerPoint за допомогою Java

  1. Налаштуйте середовище для використання Aspose.Slides for Java для конвертації PPTX у TXT
  2. Імпортуйте залежності для розбору слайдів і виведення файлів
  3. Завантажте вихідний файл PPTX у пам’ять, використовуючи клас Presentation
  4. Отримайте всі текстові кадри, щоб зібрати кожен текстовий контейнер з усіх slides
  5. Пройдіть усі абзаци та частини кадрів і додайте текст до об’єкта StringBuilder.
  6. Збережіть вихідний файл у форматі TXT

Вищезазначені кроки підсумовують процес вилучення тексту з PPTX за допомогою Java. Завантажте презентацію, отримайте доступ до всіх текстових кадрів, створіть об’єкт StringBuilder і пройдіться по всіх кадрах, щоб отримати абзаци. З кожного абзацу отримайте частини, вилучіть текст з кожної частини та додайте його до екземпляра StringBuilder, а в кінці збережіть накопичений текст у файл TXT.

Код для перетворення PPTX у TXT за допомогою Java

Цей код демонструє, як перетворити PowerPoint у текст за допомогою Java. Ви можете витягувати текст слайд за слайдом, використовуючи метод SlideUtil.getAllTextBoxes() який приймає слайд як вхідний параметр, та витягувати нотатки доповідача за допомогою методу slide.getNotesSlideManager().getNotesSlide(), а також витягувати текст з таблиць, використовуючи slide.getShapes() що повертає колекцію форм і фільтрувати кожну форму, яка є екземпляром ITable. JSON‑вивід також можна згенерувати, заповнивши JsonObject і зберігши дані у JSONArray.

Ця стаття пояснює процес перетворення PowerPoint у текст. Щоб перетворити презентацію у відео, зверніться до статті Convert PowerPoint to Video using Java.

 Українська