Витягнути таблицю з PDF в Excel за допомогою Python

Ця стаття описує, як вилучити таблицю з PDF до Excel за допомогою Python. Вона містить усі деталі щодо використання обох продуктів, тобто Aspose.PDF і Aspose.Cells, список кроків та зразковий код для вилучення таблиці Excel з PDF за допомогою Python. Зразковий код продемонструє повний процес перенесення таблиці зі сторінки PDF у лист Excel.

Кроки для вилучення таблиці з PDF в Excel за допомогою Python

  1. Налаштуйте середовище для встановлення Aspose.Total For Python via .NET
  2. Застосуйте ліцензію для відповідних імпортованих бібліотек, тобто Aspose.Cells та Aspose.PDF
  3. Завантажте вихідний PDF‑файл з таблицями, використовуючи об’єкт класу Document
  4. Створіть порожній файл Excel, використовуючи клас Workbook і задайте назву першому листу
  5. Перебрати кожну сторінку у колекції сторінок PDF‑файлу
  6. Отримайте доступ до колекції таблиць і пройдіться по кожній клітинці в таблиці
  7. Отримайте текст з клітинки PDF і скопіюйте його у відповідну клітинку в Excel‑таблиці
  8. Збережіть файл Excel на диску з даними таблиці з PDF

Ці кроки охоплюють процес вилучення даних з таблиці PDF в Excel за допомогою Python. Імпортуйте необхідні бібліотеки, завантажте вихідний PDF‑файл, отримайте доступ до кожної сторінки та колекції таблиць у ньому, і пройдіться по всіх таблицях. Нарешті, отримайте доступ до кожної клітинки в PDF‑таблиці та збережіть її вміст у відповідну клітинку вихідного листа Excel.

Код для отримання таблиці з PDF у Excel за допомогою Python

Цей код демонструє, як отримати таблицю з PDF в Excel за допомогою Python. Ви можете спробувати інший движок розпізнавання таблиць, використовуючи параметр use_flow_engine у класі TableAbsorber, щоб виявляти безрамкові таблиці у PDF. Використовуйте text_state у поглинутій клітинці, щоб отримати назву шрифту, розмір, колір фону, колір переднього плану та стиль жирний курсив для налаштування формату цільової клітинки Excel, щоб зберегти подібний формат таблиць у обох файлах.

Ця стаття допомогла зрозуміти процес перенесення таблиці PDF у Excel. Щоб встановити Python для запуску Aspose.PDF для Python через .NET, зверніться до статті [Як встановити Python для запуску Aspose].PDF для Python через .Мережа]( https://kb-qa.aspose.com/ uk/total/python/how-to-install-python-to-run-aspose-pdf-for-python-via-net/).

 Українська