Цей короткий посібник пояснює, як вилучити текст з PowerPoint за допомогою Java. Він надасть деталі щодо налаштування IDE, список кроків та зразковий код для розробки конвертера PowerPoint у текст за допомогою Java. Будуть розглянуті різні варіанти вилучення тексту з презентації.
Кроки для вилучення всього тексту з PowerPoint за допомогою Java
- Налаштуйте середовище для використання Aspose.Slides for Java для конвертації PPTX у TXT
- Імпортуйте залежності для розбору слайдів і виведення файлів
- Завантажте вихідний файл PPTX у пам’ять, використовуючи клас Presentation
- Отримайте всі текстові кадри, щоб зібрати кожен текстовий контейнер з усіх slides
- Пройдіть усі абзаци та частини кадрів і додайте текст до об’єкта StringBuilder.
- Збережіть вихідний файл у форматі TXT
Вищезазначені кроки підсумовують процес вилучення тексту з PPTX за допомогою Java. Завантажте презентацію, отримайте доступ до всіх текстових кадрів, створіть об’єкт StringBuilder і пройдіться по всіх кадрах, щоб отримати абзаци. З кожного абзацу отримайте частини, вилучіть текст з кожної частини та додайте його до екземпляра StringBuilder, а в кінці збережіть накопичений текст у файл TXT.
Код для перетворення PPTX у TXT за допомогою Java
Цей код демонструє, як перетворити PowerPoint у текст за допомогою Java. Ви можете витягувати текст слайд за слайдом, використовуючи метод SlideUtil.getAllTextBoxes() який приймає слайд як вхідний параметр, та витягувати нотатки доповідача за допомогою методу slide.getNotesSlideManager().getNotesSlide(), а також витягувати текст з таблиць, використовуючи slide.getShapes() що повертає колекцію форм і фільтрувати кожну форму, яка є екземпляром ITable. JSON‑вивід також можна згенерувати, заповнивши JsonObject і зберігши дані у JSONArray.
Ця стаття пояснює процес перетворення PowerPoint у текст. Щоб перетворити презентацію у відео, зверніться до статті Convert PowerPoint to Video using Java.