استخراج داده از فاکتورها با استفاده از پایتون

این آموزش نحوه انجام استخراج داده ها از فاکتورها با استفاده از Python را راهنمایی می کند. تمام جزئیات برای تنظیم IDE برای توسعه، لیستی از مراحل تعریف جریان برنامه و یک کد نمونه که نرم افزار فاکتور OCR را با استفاده از پایتون نشان می دهد، دارد. شما یاد خواهید گرفت که فرآیند تشخیص را از تصاویری مانند PNG، JPEG، BMP، TIFF و GIF مطابق با نیاز خود سفارشی کنید.

مراحل OCR فاکتور با استفاده از پایتون

  1. محیط را طوری تنظیم کنید که از Aspose.OCR for Python via .NET برای استخراج داده های فاکتور استفاده کند
  2. یک نمونه از Aspose.Ocr برای پردازش OCR ایجاد کنید
  3. یک نمونه از کلاس OcrInput برای نگهداری رسیدها ایجاد کنید
  4. رسیدها را به مجموعه OcrInput اضافه کنید
  5. تنظیمات تشخیص رسید را تنظیم کنید و زبان تشخیص را تنظیم کنید
  6. OCR را با استفاده از روش recognize_receipt برای تشخیص متن از رسیدهای ورودی انجام دهید
  7. نمایش متن شناخته شده از رسید

در این مراحل نحوه اعمال OCR برای رسیدها با استفاده از پایتون توضیح داده شده است. یک نمونه از شی Aspose.Ocr ایجاد کنید، شی OcrInput را برای نگهداری رسیدها مقداردهی کنید، و شی ReceiptRecognitionSettings را برای تعریف پارامترهای OCR فاکتورها ایجاد کنید. در نهایت، با ارائه لیست رسیدها و تنظیمات برای استخراج متن، متد ()شناسایی_receipt را فراخوانی کنید.

کد استخراج داده های فاکتور با استفاده از پایتون

این کد نمونه استفاده از invoice OCR API با استفاده از Python را نشان می دهد. می‌توانید نوع ورودی را روی PDF، TIFF، URL، Directory، Zip و غیره تنظیم کنید، و زبان تشخیص را از فهرست بزرگی از نام‌های زبان در شمارشگر زبان تنظیم کنید، کلاس ReceiptRecognitionSettings حاوی تعدادی ویژگی مانند تنظیم مجموعه کاراکترهای مجاز است. ، برای تنظیم وارونگی خودکار رنگ و تعیین یک لیست سیاه از کاراکترها برای نادیده گرفتن آنها پرچم گذاری کنید.

این مقاله فرآیند استخراج متن فاکتور را به ما آموزش داده است. برای تبدیل متن دست نویس به متن قابل ویرایش و جستجو، به مقاله در با استفاده از پایتون دست خط را به متن تبدیل کنید مراجعه کنید.

 فارسی