Витягнути таблицю з PDF в Excel за допомогою Java

Цей швидкий посібник пояснює, як вилучити таблицю з PDF до Excel за допомогою Java. Ви отримаєте інформацію про налаштування середовища, список кроків та зразковий код для виведення таблиці з PDF в Excel за допомогою Java. Усі необхідні деталі продемонстровано для доступу до кожної таблиці на будь‑якій сторінці PDF, отримання тексту з усіх клітинок та копіювання вмісту у відповідну клітинку у вихідній робочій книзі.

Кроки для вилучення таблиці з PDF в Excel за допомогою Java

  1. Встановіть середовище для використання Aspose.Total for Java, щоб витягнути таблицю PDF у лист Excel.
  2. Застосуйте ліцензію Aspose.Total для продуктів Aspose.PDF та Aspose.Cells
  3. Завантажте вихідний PDF‑файл у об’єкт класу Document
  4. Створіть порожній файл Excel за допомогою класу Workbook з Aspose.Cells
  5. Обробіть кожну сторінку PDF і отримайте доступ до колекції таблиць на кожній сторінці
  6. Перебирайте всі сторінки та отримуйте доступ до кожної клітини по одній
  7. Отримати текст з кожної клітинки та зберегти вміст у відповідному рядку та стовпці у листі призначення.
  8. Автоматично підлаштуйте ширину стовпців у листі та збережіть вихідний файл Excel

Дотримуйтесь цих кроків, щоб отримати таблицю з PDF в Excel за допомогою Java. Розпочніть процес, завантаживши вихідний PDF‑файл, отримавши доступ до всіх його сторінок, розбираючи кожну сторінку окремо, отримуючи колекцію таблиць на кожній сторінці та отримуючи доступ до кожної клітинки у вибраній таблиці. Об’єднайте текст у клітинці в рядок і збережіть вміст у відповідному рядку та колонці на конкретному листі вихідного Excel‑файлу.

Код для витягнення таблиці Excel з PDF за допомогою Java

Цей код демонструє, як вилучити дані з таблиці PDF у Excel за допомогою Java. Формат тексту вихідного PDF можна застосувати до таблиці листа Excel, отримуючи колір клітинки таблиці PDF, стиль жирний/курсив, назву та розмір шрифту, і встановлюючи те саме в клітинку Excel під час запису вмісту. Будьте уважні при обробці об’єднаних таблиць у PDF та їх створенні в файлі Excel, щоб зберегти таку ж організацію вмісту таблиці.

У цій статті пояснюється процес копіювання тексту з таблиці PDF у таблицю Excel. Щоб конвертувати сканований PDF у редагований PDF, зверніться до статті Конвертувати сканований PDF у редагований PDF за допомогою Java.

 Українська