Извличане на таблица от PDF към Excel с Java

Това бързо ръководство обяснява как да извлечете таблица от PDF до Excel с Java. Ще получите информация за настройване на средата, списък със стъпки и примерен код за извличане на таблица от PDF в Excel с Java. Всички необходими детайли са демонстрирани за достъп до всяка таблица на всяка PDF страница, достъп до текста от всички клетки и копиране на съдържанието в съответната клетка в изходната работна книга.

Стъпки за извличане на таблица от PDF в Excel с Java

  1. Настройте средата да използва Aspose.Total for Java за извличане на таблицата от PDF в Excel листа
  2. Прилагайте лиценз Aspose.Total за продуктите Aspose.PDF и Aspose.Cells
  3. Заредете изходния PDF файл в обекта на класа Document
  4. Създайте празен Excel файл, използвайки класа Workbook от Aspose.Cells
  5. Прегледайте всяка страница в PDF и достъпете колекцията от таблици на всяка страница
  6. Итерайте през всички страници и достъпвайте всяка клетка една по една
  7. Извлечете текста от всяка клетка и запазете съдържанието в съответния ред и колона в целевия лист
  8. Автоматично оразмеряване на колоните в листа и запазване на изходния Excel файл

Следвайте тези стъпки, за да получите таблица от PDF към Excel с Java. Започнете процеса, като заредите изходния PDF файл, достъпите всички страници в него, парсирате всяка страница отделно, получите колекцията от таблици на всяка страница и достъпите всяка клетка в избраната таблица. Обединете текста в клетка в низ и запазете съдържанието в съответния ред и колона на конкретния лист от изходния Excel файл.

Код за извличане на Excel таблица от PDF с Java

Този код демонстрира как да извлечете данни от PDF таблица в Excel, използвайки Java. Форматът на текста в изходния PDF може да бъде приложен към таблицата в Excel листа, като се извлече цветът на клетката в PDF таблицата, стилът удебелен/наклонен, името и размерът на шрифта, и се зададе същото в Excel клетката при записване на съдържанието. Внимавайте при обработката на слети таблици в PDF и създаването им в Excel файл, за да запазите същата организация на съдържанието на таблицата.

Тази статия обяснява процеса на копиране на текст от таблица в PDF към таблица в Excel. За да конвертирате сканиран PDF в редактиран PDF, вижте статията Конвертиране на сканиран PDF в редактиран PDF с Java.

 Български