У цьому підручнику описано, як виконувати вилучення даних із рахунків-фактур за допомогою Python. У ньому є всі деталі, щоб налаштувати IDE для розробки, список кроків, що визначають потік програми, і зразок коду, що демонструє програмне забезпечення OCR для рахунків-фактур за допомогою Python. Ви навчитеся налаштовувати процес виявлення за такими зображеннями, як PNG, JPEG, BMP, TIFF і GIF відповідно до ваших вимог.
Кроки для OCR рахунків-фактур за допомогою Python
- Налаштуйте середовище для використання Aspose.OCR for Python via .NET для отримання даних рахунків-фактур
- Створіть екземпляр Aspose.Ocr для обробки OCR
- Створіть екземпляр класу OcrInput для зберігання квитанцій
- Додайте квитанції до колекції OcrInput
- Налаштуйте параметри розпізнавання квитанцій і встановіть мову розпізнавання
- Виконайте OCR за допомогою методу recognize_receipt, щоб розпізнати текст із квитанцій про введення
- Відображати розпізнаний текст із квитанцій
Ці кроки описують, як застосувати OCR для квитанцій за допомогою Python. Створіть екземпляр об’єкта Aspose.Ocr, ініціалізуйте об’єкт OcrInput для зберігання квитанцій і створіть об’єкт ReceiptRecognitionSettings для визначення параметрів OCR для рахунків-фактур. Нарешті, викличте метод accept_receipt(), надавши список квитанцій і параметри для вилучення тексту.
Код для вилучення даних рахунків-фактур за допомогою Python
Цей зразок коду демонструє використання API OCR для рахунків-фактур за допомогою Python. Ви можете встановити тип введення як PDF, TIFF, URL, Directory, Zip тощо, а також встановити мову виявлення з великого списку назв мов у перелічильнику мов. Клас ReceiptRecognitionSettings містить низку властивостей, як-от встановлення дозволеного набору символів , прапорець для встановлення автоматичної інверсії кольорів і визначення чорного списку символів для їх ігнорування.
Ця стаття навчила нас процесу отримання тексту рахунку-фактури. Щоб перетворити рукописний текст на редагований і доступний для пошуку, зверніться до статті на Перетворення рукописного тексту на текст за допомогою Python.