การดึงข้อมูลจากใบแจ้งหนี้โดยใช้ Python

บทช่วยสอนนี้จะแนะนำวิธีดำเนินการดึงข้อมูลจากใบแจ้งหนี้โดยใช้ Python โดยมีรายละเอียดทั้งหมดสำหรับการตั้งค่า IDE สำหรับการพัฒนา รายการขั้นตอนในการกำหนดขั้นตอนการทำงานของโปรแกรม และตัวอย่างโค้ดที่สาธิตซอฟต์แวร์ OCR สำหรับใบแจ้งหนี้โดยใช้ Python คุณจะได้เรียนรู้วิธีปรับแต่งกระบวนการตรวจจับจากภาพต่างๆ เช่น PNG, JPEG, BMP, TIFF และ GIF ตามความต้องการของคุณ

ขั้นตอนการทำ OCR ใบแจ้งหนี้โดยใช้ Python

  1. ตั้งค่าสภาพแวดล้อมที่จะใช้ Aspose.OCR for Python via .NET สำหรับการแยกข้อมูลใบแจ้งหนี้
  2. สร้างอินสแตนซ์ของ Aspose.Ocr สำหรับการประมวลผล OCR
  3. สร้างอินสแตนซ์ของคลาส OcrInput เพื่อเก็บใบเสร็จ
  4. เพิ่มใบเสร็จลงในคอลเลกชัน OcrInput
  5. ตั้งค่าการจดจำใบเสร็จและตั้งค่าภาษาการจดจำ
  6. ดำเนินการ OCR โดยใช้เมธอด recognize_receipt เพื่อรับรู้ข้อความจากใบรับอินพุต
  7. แสดงข้อความที่รู้จักจากใบเสร็จ

ขั้นตอนเหล่านี้อธิบายวิธีการใช้ OCR สำหรับใบเสร็จโดยใช้ Python สร้างอินสแตนซ์ของอ็อบเจ็กต์ Aspose.Ocr เริ่มต้นอ็อบเจ็กต์ OcrInput สำหรับเก็บใบเสร็จ และสร้างอ็อบเจ็กต์ ReceiptRecognitionSettings สำหรับกำหนดพารามิเตอร์สำหรับ OCR ของใบแจ้งหนี้ สุดท้าย เรียกใช้เมธอดcogniz_receipt() โดยระบุรายการใบเสร็จและการตั้งค่าสำหรับการแยกข้อความ

โค้ดสำหรับการดึงข้อมูลใบแจ้งหนี้โดยใช้ Python

โค้ดตัวอย่างนี้สาธิตการใช้งาน API OCR สำหรับใบแจ้งหนี้โดยใช้ Python คุณสามารถตั้งค่าประเภทอินพุตเป็น PDF, TIFF, URL, Directory, Zip เป็นต้น และตั้งค่าภาษาในการตรวจจับจากรายชื่อภาษาจำนวนมากในตัวระบุภาษา คลาส ReceiptRecognitionSettings มีคุณสมบัติหลายอย่าง เช่น ตั้งค่าชุดอักขระที่อนุญาต ตั้งค่าการกลับสีอัตโนมัติ และกำหนดรายการอักขระที่ไม่อนุญาตสำหรับการละเว้นอักขระเหล่านี้

บทความนี้สอนเราเกี่ยวกับกระบวนการแยกข้อความใบแจ้งหนี้ หากต้องการแปลงข้อความที่เขียนด้วยลายมือเป็นข้อความที่แก้ไขและค้นหาได้ โปรดอ่านบทความที่ แปลงลายมือเป็นข้อความโดยใช้ Python

 ไทย