Това бързо ръководство обяснява как да извлечете таблица от PDF до Excel с Java. Ще получите информация за настройване на средата, списък със стъпки и примерен код за извличане на таблица от PDF в Excel с Java. Всички необходими детайли са демонстрирани за достъп до всяка таблица на всяка PDF страница, достъп до текста от всички клетки и копиране на съдържанието в съответната клетка в изходната работна книга.
Стъпки за извличане на таблица от PDF в Excel с Java
- Настройте средата да използва Aspose.Total for Java за извличане на таблицата от PDF в Excel листа
- Прилагайте лиценз Aspose.Total за продуктите Aspose.PDF и Aspose.Cells
- Заредете изходния PDF файл в обекта на класа Document
- Създайте празен Excel файл, използвайки класа Workbook от Aspose.Cells
- Прегледайте всяка страница в PDF и достъпете колекцията от таблици на всяка страница
- Итерайте през всички страници и достъпвайте всяка клетка една по една
- Извлечете текста от всяка клетка и запазете съдържанието в съответния ред и колона в целевия лист
- Автоматично оразмеряване на колоните в листа и запазване на изходния Excel файл
Следвайте тези стъпки, за да получите таблица от PDF към Excel с Java. Започнете процеса, като заредите изходния PDF файл, достъпите всички страници в него, парсирате всяка страница отделно, получите колекцията от таблици на всяка страница и достъпите всяка клетка в избраната таблица. Обединете текста в клетка в низ и запазете съдържанието в съответния ред и колона на конкретния лист от изходния Excel файл.
Код за извличане на Excel таблица от PDF с Java
Този код демонстрира как да извлечете данни от PDF таблица в Excel, използвайки Java. Форматът на текста в изходния PDF може да бъде приложен към таблицата в Excel листа, като се извлече цветът на клетката в PDF таблицата, стилът удебелен/наклонен, името и размерът на шрифта, и се зададе същото в Excel клетката при записване на съдържанието. Внимавайте при обработката на слети таблици в PDF и създаването им в Excel файл, за да запазите същата организация на съдържанието на таблицата.
Тази статия обяснява процеса на копиране на текст от таблица в PDF към таблица в Excel. За да конвертирате сканиран PDF в редактиран PDF, вижте статията Конвертиране на сканиран PDF в редактиран PDF с Java.