Тази статия описва как да извлечете таблица от PDF до Excel с помощта на Python. Тя съдържа всички детайли за използване и на двата продукта, т.е. Aspose.PDF и Aspose.Cells, списък със стъпки и примерен код за извличане на Excel таблица от PDF с Python. Примерният код ще демонстрира целия процес, като прехвърля таблицата от страница на PDF към лист в Excel.
Стъпки за извличане на таблица от PDF в Excel с Python
- Настройте средата за инсталиране Aspose.Total For Python via .NET
- Прилагайте лиценза за съответните импортирани библиотеки, т.е. Aspose.Cells и Aspose.PDF
- Заредете изходния PDF файл с таблици, използвайки обекта от клас Document
- Създайте празен Excel файл, използвайки класа Workbook и задайте име за първия лист
- Итерирайте през всяка страница в колекцията от страници в PDF файла
- Достъп до колекцията от таблици и обхождане на всяка клетка в таблицата
- Извлечете текста от PDF клетката и го копирайте в съответната клетка в листа на Excel
- Запазете Excel файла на диска с данните от таблицата от PDF
Тези стъпки включват процеса за извличане на данни от PDF таблица в Excel с помощта на Python. Импортирайте необходимите библиотеки, заредете изходния PDF файл, достъпете всяка страница и колекция от таблици в него и преминете през всички таблици. Накрая, достъпете всяка клетка в PDF таблицата и запазете нейното съдържание в съответната клетка в изходния Excel лист.
Код за извличане на таблица от PDF в Excel с Python
Този код демонстрира как да получите таблица от PDF в Excel с помощта на Python. Можете да опитате различен двигател за разпознаване на таблици, използвайки опцията use_flow_engine в класа TableAbsorber, за да откриете таблици без граници в PDF. Използвайте text_state в абсорбираната клетка, за да извлечете името на шрифта, размера, цвета на фона, цвета на предния план и стила bold Italic за персонализиране на формата на целевата Excel клетка, за да запазите формата на таблиците подобна и в двата файла.
Тази статия помогна за разбирането на процеса по прехвърляне на PDF таблица в Excel. За да инсталирате Python, за да изпълнявате Aspose.PDF за Python чрез .NET, вижте статията Как да инсталирате Python за изпълнение на Aspose.PDF за Python чрез .NET.