Цей короткий посібник описує, як вилучити текст з PowerPoint за допомогою Python. У ньому є деталі щодо налаштування IDE, список кроків та зразковий код для перетворення PowerPoint у текст за допомогою Python. Будуть розглянуті різні техніки отримання тексту зі слайдів.
Кроки з вилучення тексту з PPTX за допомогою Python
- Налаштуйте IDE на використання Aspose.Slides for Python via .NET для вилучення тексту
- Імпортуйте потрібні класи з бібліотеки та утилітний клас SlideUtil
- Визначте шляхи до вхідних/вихідних файлів і завантажте ліцензію
- Завантажте вихідну презентацію PowerPoint у об’єкт Presentation
- Використовуйте SlideUtil.get_all_text_frames для вилучення всіх текстових кадрів з кожного слайду
- Пройдіть усі текстові кадри та їхні абзаци, щоб зібрати окремі частини тексту
- Обробляйте кожен кадр і додавайте вміст слайдів у новий рядок
- Збережіть усі зібрані текстові фрагменти та збережіть результат у файл TXT
Ці кроки пояснюють процес розробки конвертера PPTX у текст за допомогою Python. Завантажте презентацію, отримайте всі текстові кадри, розберіть кожен абзац у всіх кадрах і отримайте текст з їхніх частин. Збережіть усі зібрані дані у текстовий файл з роздільником рядка для кожного текстового сегмента.
Код конвертера PowerPoint у текст за допомогою Python
Цей код показує, як конвертувати PPTX у TXT за допомогою Python. Замість сканування всієї презентації одразу, ви можете отримати доступ до кожного слайду окремо та обробити його, щоб отримати текст лише з вибраних слайдів. Інший варіант — не завантажувати презентацію в пам’ять, а просто використати шлях до файлу, щоб витягти її текст з прапорцем, який визначає порядок витягування: у вихідному порядку або у плоскому порядку.
Ця коротка стаття пояснює, як витягнути текст з PPTX. Щоб конвертувати презентацію у відео, зверніться до статті Convert PowerPoint to video using Python.