ดึงข้อความจาก PowerPoint ด้วย Java

บทแนะนำสั้นนี้อธิบายวิธี ดึงข้อความจาก PowerPoint ด้วย Java. จะให้รายละเอียดเกี่ยวกับการตั้งค่า IDE รายการขั้นตอน และตัวอย่างโค้ดสำหรับพัฒนา ตัวแปลง PowerPoint เป็นข้อความด้วย Java. จะมีการอภิปรายตัวเลือกต่าง ๆ สำหรับการดึงข้อความจากงานนำเสนอ.

ขั้นตอนการดึงข้อความทั้งหมดจาก PowerPoint ด้วย Java

  1. ตั้งค่าสภาพแวดล้อมให้ใช้ Aspose.Slides for Java เพื่อแปลง PPTX เป็น TXT
  2. นำเข้า dependencies สำหรับการแยกสไลด์และการส่งออกไฟล์
  3. โหลดไฟล์ PPTX ต้นฉบับเข้าสู่หน่วยความจำโดยใช้คลาส Presentation
  4. ดึงเฟรมข้อความทั้งหมดเพื่อเก็บคอนเทนเนอร์ข้อความทุกอันจาก slides
  5. วิเคราะห์ผ่านย่อหน้าทั้งหมดของเฟรมและส่วนต่าง ๆ, แล้วเพิ่มข้อความลงในอ็อบเจ็กต์ StringBuilder
  6. บันทึกไฟล์ผลลัพธ์เป็นไฟล์ TXT

ขั้นตอนที่กล่าวมาข้างต้นสรุปกระบวนการเพื่อ extract text from PPTX using Java. โหลดการนำเสนอ, เข้าถึงทุกเฟรมข้อความ, สร้างอ็อบเจกต์ StringBuilder, และวนซ้ำผ่านทุกเฟรมเพื่อดึงย่อหน้า. จากแต่ละย่อหน้า, ดึงส่วนต่าง ๆ, แยกข้อความจากแต่ละส่วนและต่อเข้ากับอินสแตนซ์ของ StringBuilder, และในที่สุดบันทึกข้อความที่สะสมไว้เป็นไฟล์ TXT.

โค้ดสำหรับแปลง PPTX เป็น TXT ด้วย Java

โค้ดนี้แสดงวิธีการ แปลง PowerPoint เป็นข้อความโดยใช้ Java. คุณสามารถดึงข้อความจากสไลด์ทีละสไลด์โดยใช้เมธอด SlideUtil.getAllTextBoxes() ที่รับสไลด์เป็นอินพุต, และดึงโน้ตของผู้พูดโดยใช้เมธอด slide.getNotesSlideManager().getNotesSlide(), และดึงข้อความจากตารางโดยใช้เมธอด slide.getShapes() ที่คืนคอลเลกชันของรูปร่างและกรองแต่ละรูปร่างที่เป็นอินสแตนซ์ของ ITable. ผลลัพธ์ JSON ยังสามารถสร้างได้โดยการเติม JsonObject และบันทึกข้อมูลใน JSONArray.

บทความนี้อธิบายกระบวนการแปลง PowerPoint เป็นข้อความ. เพื่อแปลงการนำเสนอเป็นวิดีโอ, ดูบทความ Convert PowerPoint to Video using Java.

 ไทย