บทช่วยสอนสั้นๆ นี้ให้รายละเอียดเกี่ยวกับวิธี แปลง PDF เป็นข้อความใน Java โดยการโหลดเอกสารอินพุต PDF และบันทึกเป็นรูปแบบ Text นอกจากนี้ การใช้ Java PDF to Text converter สามารถปรับแต่งเพื่อควบคุมว่าคุณต้องการให้เอาต์พุต Text มีหรือไม่มีรูปแบบเมื่อเทียบกับไฟล์ PDF ต้นทาง
ขั้นตอนในการแปลง PDF เป็นข้อความใน Java
- กำหนดค่าแอปพลิเคชันของคุณโดยเพิ่มการอ้างอิงไปยัง Aspose.PDF จากที่เก็บ Maven เพื่อแปลง PDF เป็นไฟล์ข้อความ
- โหลดไฟล์ PDF อินพุตด้วยวัตถุคลาส Document สำหรับการแปลง PDF เป็นไฟล์ข้อความ
- สร้างออบเจกต์ของคลาส TextAbsorber เพื่อตั้งค่าตัวเลือกการดึงข้อความ
- เขียนข้อความที่แยกออกมาไปยังไฟล์ข้อความ
ขั้นตอนข้างต้นอธิบายขั้นตอนการพัฒนาแอปพลิเคชันตัวแปลงที่ใช้ PDF เป็น Text Java ในขั้นตอนแรก เอกสาร PDF ที่ป้อนจะถูกโหลดโดยใช้อินสแตนซ์ของคลาส Document จากนั้นเลือกว่าคุณต้องการให้ข้อความที่มีการจัดรูปแบบหรือไม่ สุดท้าย คุณสามารถใช้สตริงข้อความเพื่อเขียนลงในไฟล์หรือประมวลผลเพิ่มเติมตามความต้องการของคุณ
รหัสเพื่อแปลง PDF เป็นข้อความใน Java
โค้ดตัวอย่างนี้แสดงให้เห็นว่าการใช้ Java แปลง PDF เป็นข้อความ ด้วยการควบคุมเต็มรูปแบบโดยใช้ตัวเลือกต่างๆ เช่น คลาส TextAbsorber มีตัวสร้างหลายตัว ซึ่งคุณสามารถใช้ TextSearchOptions ซึ่งมีตัวเลือกในการแปลงข้อความที่แรเงาใน PDF ต้นทางเป็นข้อความแยกต่างหาก ในทำนองเดียวกัน คุณสามารถตั้งค่าสถานะเพื่อค้นหาข้อความเฉพาะภายในขอบเขตของเพจ หรือตั้งค่าสี่เหลี่ยมผืนผ้าเพื่อค้นหาข้อความจากพื้นที่ที่ระบุเฉพาะในทุกเพจ
ที่นี่เราได้เรียนรู้วิธีแปลง PDF เป็นข้อความใน Java พร้อมกับข้อมูลโค้ด หากคุณต้องการเรียนรู้ขั้นตอนการแปลง PDF เป็น Word โปรดดูบทความใน วิธีแปลง PDF เป็น Word ใน Java