คู่มือสั้นนี้อธิบายวิธี ดึงข้อความจาก PowerPoint ด้วย Python. มีรายละเอียดการตั้งค่า IDE รายการขั้นตอน และตัวอย่างโค้ดเพื่อ แปลง PowerPoint เป็นข้อความด้วย Python. จะมีการอธิบายเทคนิคต่าง ๆ เพื่อดึงข้อความจากสไลด์.
ขั้นตอนการดึงข้อความจาก PPTX ด้วย Python
- ตั้งค่า IDE ให้ใช้ Aspose.Slides for Python via .NET เพื่อดึงข้อความ
- นำเข้าคลาสที่ต้องการจากไลบรารีและคลาสยูทิลิตี้ SlideUtil
- กำหนดเส้นทางไฟล์อินพุต/เอาต์พุตและโหลดใบอนุญาต
- โหลดงานนำเสนอ PowerPoint ต้นฉบับเข้าสู่วัตถุ Presentation
- ใช้ SlideUtil.get_all_text_frames เพื่อดึงกรอบข้อความทั้งหมดจากทุกสไลด์
- วิเคราะห์ผ่านกรอบข้อความทั้งหมดและย่อหน้าของมันเพื่อรวบรวมส่วนข้อความแต่ละส่วน
- ประมวลผลแต่ละเฟรมและเพิ่มเนื้อหาสไลด์ในบรรทัดใหม่
- บันทึกส่วนข้อความที่รวบรวมทั้งหมดและบันทึกผลลัพธ์เป็นไฟล์ TXT
ขั้นตอนเหล่านี้อธิบายกระบวนการพัฒนา PPTX to text converter using Python. โหลดงานนำเสนอ, ดึงเฟรมข้อความทั้งหมดจากมัน, แยกวิเคราะห์แต่ละย่อหน้าในทุกเฟรม, และดึงข้อความจากส่วนต่าง ๆ ของมัน. บันทึกข้อมูลที่รวบรวมทั้งหมดลงในไฟล์ข้อความโดยใช้ตัวคั่นบรรทัดสำหรับแต่ละส่วนข้อความ.
โค้ดสำหรับแปลง PowerPoint เป็นข้อความโดยใช้ Python
โค้ดนี้แสดงวิธี แปลง PPTX เป็น TXT ด้วย Python แทนที่จะสแกนการนำเสนอทั้งหมดในครั้งเดียว คุณสามารถเข้าถึงแต่ละสไลด์แยกกันและประมวลผลเพื่อดึงข้อความจากสไลด์ที่เลือกเท่านั้น อีกทางเลือกหนึ่งคือคุณไม่ต้องโหลดการนำเสนอเข้าสู่หน่วยความจำและใช้เพียงเส้นทางไฟล์เพื่อสกัดข้อความของมันโดยใช้แฟล็กเพื่อดึงข้อความตามลำดับที่จัดเรียงไว้ ไม่ว่าจะเป็นตามต้นฉบับหรือในลำดับแบน.
บทความสั้นนี้แนะนำวิธีการดึงข้อความจากไฟล์ PPTX. หากต้องการแปลงการนำเสนอเป็นวิดีโอ โปรดดูบทความ Convert PowerPoint to video using Python.