Ekstrak Tabel dari PDF ke Excel menggunakan Java

Panduan cepat ini menjelaskan cara mengekstrak tabel dari PDF ke Excel menggunakan Java. Anda akan mendapatkan informasi untuk menyiapkan lingkungan, daftar langkah, dan contoh kode untuk menarik tabel dari PDF ke Excel menggunakan Java. Semua detail yang diperlukan ditunjukkan untuk mengakses setiap tabel pada halaman PDF mana pun, mengakses teks dari semua sel, dan menyalin kontennya ke sel yang sesuai di Workbook output.

Langkah-langkah untuk Mengekstrak Tabel dari PDF ke Excel menggunakan Java

  1. Atur lingkungan untuk menggunakan Aspose.Total for Java untuk mengekstrak tabel PDF ke lembar Excel.
  2. Terapkan lisensi Aspose.Total untuk produk Aspose.PDF dan Aspose.Cells
  3. Muat file PDF sumber ke dalam objek kelas Document
  4. Buat file Excel kosong menggunakan kelas Workbook dari Aspose.Cells
  5. Telusuri setiap halaman dalam PDF dan akses koleksi tabel pada setiap halaman
  6. Iterasi melalui semua halaman dan akses setiap sel satu per satu
  7. Ambil teks dari setiap sel dan simpan kontennya ke baris serta kolom yang bersangkutan di lembar tujuan
  8. Sesuaikan lebar kolom secara otomatis di lembar dan simpan file Excel hasil

Ikuti langkah-langkah ini untuk mengambil tabel dari PDF ke Excel menggunakan Java. Mulailah proses dengan memuat file PDF sumber, mengakses semua halaman di dalamnya, mem-parsing setiap halaman secara terpisah, mendapatkan kumpulan tabel pada setiap halaman, dan mengakses setiap sel dalam tabel yang dipilih. Gabungkan teks dalam sebuah sel menjadi string dan simpan kontennya di baris dan kolom yang sesuai pada lembar khusus dari file Excel output.

Kode untuk Mengekstrak Tabel Excel dari PDF menggunakan Java

Kode ini menunjukkan cara mengekstrak data dari tabel PDF ke Excel menggunakan Java. Format teks PDF sumber dapat diterapkan ke tabel lembar Excel dengan mengambil warna sel tabel PDF, gaya tebal/miring, nama dan ukuran font, serta mengatur yang sama pada sel Excel saat menulis konten. Hati-hati saat menangani tabel yang digabungkan dalam PDF dan membuat yang sama dalam file Excel untuk menjaga organisasi isi tabel tetap sama.

Artikel ini mengajarkan proses menyalin teks dari tabel PDF ke tabel lembar Excel. Untuk mengonversi PDF yang dipindai menjadi PDF yang dapat diedit, lihat artikel Mengonversi PDF yang dipindai menjadi PDF yang dapat diedit menggunakan Java.

 Indonesian