Този урок ръководи как да извършите извличане на данни от фактури с помощта на Python. Има всички подробности за настройване на IDE за разработката, списък със стъпки, определящи потока на програмата, и примерен код, демонстриращ софтуера за OCR за фактури с помощта на Python. Ще се научите да персонализирате процеса на откриване от изображения като PNG, JPEG, BMP, TIFF и GIF според вашите изисквания.
Стъпки за OCR на фактури с помощта на Python
- Задайте средата да използва Aspose.OCR for Python via .NET за извличане на данни от фактури
- Създайте екземпляр на Aspose.Ocr за OCR обработка
- Създайте екземпляр на класа OcrInput за съхраняване на разписки
- Добавете разписки към колекцията OcrInput
- Настройте настройки за разпознаване на разписки и задайте език за разпознаване
- Извършете OCR, като използвате метода recognize_receipt, за да разпознаете текст от разписките за въвеждане
- Показване на разпознат текст от разписките
Тези стъпки описват как да приложите OCR за разписки с помощта на Python. Създайте екземпляр на обекта Aspose.Ocr, инициализирайте обекта OcrInput за съхраняване на разписки и създайте обекта ReceiptRecognitionSettings за дефиниране на параметрите за OCR на фактурите. И накрая, извикайте метода accept_receipt(), като предоставите списъка с разписки и настройките за извличане на текста.
Код за извличане на данни от фактури с помощта на Python
Този примерен код демонстрира използването на invoice OCR API с помощта на Python. Можете да зададете типа на въвеждане на PDF, TIFF, URL, Directory, Zip и т.н. и да зададете език за откриване от голям списък с имена на езици в изброителя на езика. Класът ReceiptRecognitionSettings съдържа редица свойства, като например настройка на позволения набор от знаци , флаг за задаване на автоматична инверсия на цветовете и дефиниране на черен списък със знаци за игнорирането им.
Тази статия ни научи на процеса на извличане на текст на фактура. За да конвертирате ръкописен текст в текст с възможност за редактиране и търсене, вижте статията на Преобразувайте ръкописен текст в текст с помощта на Python.