บทความนี้อธิบายวิธี ดึงตารางจาก PDF ไปยัง Excel ด้วย Python. มีรายละเอียดทั้งหมดเพื่อใช้ผลิตภัณฑ์ทั้งสอง ได้แก่ Aspose.PDF และ Aspose.Cells, รายการขั้นตอน, และตัวอย่างโค้ดเพื่อ ดึงตาราง Excel จาก PDF ด้วย Python. ตัวอย่างโค้ดจะแสดงกระบวนการทั้งหมดโดยการย้ายตารางจากหน้า PDF ไปยังแผ่นงาน Excel.
ขั้นตอนการดึงตารางจาก PDF ไปยัง Excel ด้วย Python
- ตั้งค่าสภาพแวดล้อมเพื่อทำการติดตั้ง Aspose.Total For Python via .NET
- ใช้ใบอนุญาตสำหรับไลบรารีที่นำเข้าที่เกี่ยวข้อง เช่น Aspose.Cells และ Aspose.PDF
- โหลดไฟล์ PDF ต้นฉบับที่มีตารางโดยใช้คลาสอ็อบเจกต์ Document
- สร้างไฟล์ Excel ว่างโดยใช้คลาส Workbook และตั้งชื่อให้แผ่นแรก
- วนซ้ำผ่านแต่ละหน้าในคอลเลกชันของหน้าในไฟล์ PDF
- เข้าถึงคอลเลกชันของตารางและแยกวิเคราะห์ผ่านแต่ละเซลล์ในตาราง
- ดึงข้อความจากเซลล์ PDF แล้วคัดลอกไปยังเซลล์ที่สอดคล้องกันในแผ่นงาน Excel
- บันทึกไฟล์ Excel ลงบนดิสก์พร้อมข้อมูลตารางจาก PDF
ขั้นตอนเหล่านี้รวมถึงกระบวนการ ดึงข้อมูลจากตาราง PDF ไปยัง Excel ด้วย Python การนำเข้าไลบรารีที่จำเป็น โหลดไฟล์ PDF ต้นฉบับ เข้าถึงแต่ละหน้าและชุดของตารางบนไฟล์นั้น และทำการแยกวิเคราะห์ทุกตาราง สุดท้ายเข้าถึงแต่ละเซลล์ในตาราง PDF และบันทึกเนื้อหาของมันลงในเซลล์ที่สอดคล้องกันในแผ่นงาน Excel ที่ส่งออก
โค้ดเพื่อดึงตารางจาก PDF ไปยัง Excel ด้วย Python
โค้ดนี้แสดงวิธีการ รับตารางจาก PDF ไปยัง Excel ด้วย Python. คุณอาจลองใช้เครื่องมือจดจำตารางแบบอื่นโดยใช้ตัวเลือก use_flow_engine ในคลาส TableAbsorber เพื่อค้นหาตารางที่ไม่มีขอบใน PDF. ใช้ text_state ในเซลล์ที่ดูดซับเพื่อดึงชื่อฟอนต์, ขนาด, สีพื้นหลัง, สีตัวอักษร, และสไตล์ตัวหนาเอียง เพื่อปรับแต่งรูปแบบเซลล์ Excel ปลายทางให้คงรูปแบบตารางให้คล้ายกันในทั้งสองไฟล์.
บทความนี้ช่วยให้เข้าใจกระบวนการแปลงตาราง PDF ไปยัง Excel ได้ดีขึ้น เพื่อทำการติดตั้ง Python เพื่อรัน Aspose.PDF สำหรับ Python ผ่าน .NET โปรดดูบทความ วิธีการติดตั้ง Python เพื่อรัน Aspose.PDF สำหรับ Python ผ่าน .เน็ต.