ดึงตารางจาก PDF ไปยัง Excel ด้วย Java

คู่มือสั้นนี้อธิบายวิธี ดึงตารางจาก PDF ไปยัง Excel ด้วย Java. คุณจะได้รับข้อมูลเพื่อกำหนดสภาพแวดล้อม รายการขั้นตอน และตัวอย่างโค้ดเพื่อ ดึงตารางจาก PDF ไปยัง Excel ด้วย Java. รายละเอียดที่จำเป็นทั้งหมดได้ถูกสาธิตเพื่อเข้าถึงตารางทุกตารางบนหน้า PDF ใด ๆ เข้าถึงข้อความจากทุกเซลล์และคัดลอกเนื้อหาไปยังเซลล์ที่สอดคล้องกันใน Workbook ผลลัพธ์.

ขั้นตอนการดึงตารางจาก PDF ไปยัง Excel ด้วย Java

  1. ตั้งค่าสภาพแวดล้อมให้ใช้ Aspose.Total for Java เพื่อดึงตาราง PDF ไปยังแผ่นงาน Excel
  2. ใช้ใบอนุญาต Aspose.Total สำหรับผลิตภัณฑ์ Aspose.PDF และ Aspose.Cells
  3. โหลดไฟล์ PDF ต้นฉบับเข้าสู่วัตถุคลาส Document
  4. สร้างไฟล์ Excel ว่างโดยใช้คลาส Workbook จาก Aspose.Cells
  5. วิเคราะห์แต่ละหน้าใน PDF และเข้าถึงคอลเลกชันตารางบนแต่ละหน้า
  6. วนซ้ำผ่านทุกหน้าและเข้าถึงแต่ละเซลล์ทีละหนึ่ง
  7. ดึงข้อความจากแต่ละเซลล์และบันทึกเนื้อหาไปยังแถวและคอลัมน์ที่สอดคล้องกันในแผ่นงานปลายทาง
  8. ปรับขนาดคอลัมน์ในแผ่นให้พอดีและบันทึกไฟล์ Excel ที่ได้ออกมา

ทำตามขั้นตอนเหล่านี้เพื่อ ดึงตารางจาก PDF ไปยัง Excel ด้วย Java. เริ่มกระบวนการโดยการโหลดไฟล์ PDF ต้นฉบับ, เข้าถึงทุกหน้าในไฟล์, แยกวิเคราะห์แต่ละหน้าแยกกัน, รับชุดของตารางในแต่ละหน้า, และเข้าถึงแต่ละเซลล์ในตารางที่เลือก. รวมข้อความภายในเซลล์เป็นสตริงและบันทึกเนื้อหาในแถวและคอลัมน์ที่สอดคล้องกันบนแผ่นงานเฉพาะของไฟล์ Excel ผลลัพธ์.

โค้ดสำหรับดึงตาราง Excel จาก PDF ด้วย Java

โค้ดนี้แสดงวิธีการ ดึงข้อมูลจากตาราง PDF ไปยัง Excel ด้วย Java. รูปแบบข้อความของ PDF ต้นฉบับสามารถนำไปใช้กับตารางในแผ่นงาน Excel ได้โดยการดึงสีของเซลล์ตาราง PDF, สไตล์ตัวหนา/ตัวเอียง, ชื่อและขนาดฟอนต์, แล้วตั้งค่าเดียวกันในเซลล์ Excel ขณะเขียนเนื้อหา. ระวังการจัดการตารางที่รวมกันใน PDF และการสร้างตารางเดียวกันในไฟล์ Excel เพื่อให้การจัดระเบียบเนื้อหาตารางคงเดิม.

บทความนี้สอนกระบวนการคัดลอกข้อความจากตาราง PDF ไปยังตารางในแผ่นงาน Excel. เพื่อแปลง PDF สแกนให้เป็น PDF ที่แก้ไขได้, ดูบทความ แปลง PDF สแกนเป็น PDF ที่แก้ไขได้โดยใช้ Java.

 ไทย