Este tutorial le muestra cómo realizar la extracción de datos de facturas con Python. Contiene todos los detalles para configurar el IDE para el desarrollo, una lista de pasos que definen el flujo del programa y un código de muestra que demuestra el software de OCR de facturas con Python. Aprenderá a personalizar el proceso de detección a partir de imágenes como PNG, JPEG, BMP, TIFF y GIF según sus requisitos.
Pasos para el reconocimiento óptico de caracteres de facturas con Python
- Configurar el entorno para utilizar Aspose.OCR for Python via .NET para extraer datos de facturas
- Crear una instancia de Aspose.Ocr para el procesamiento de OCR
- Crear una instancia de la clase OcrInput para almacenar recibos
- Agregar recibos a la colección OcrInput
- Configurar los ajustes de reconocimiento de recibos y establecer el idioma de reconocimiento
- Realice OCR utilizando el método recognize_receipt para reconocer el texto de los recibos de entrada
- Mostrar texto reconocido de los recibos
Estos pasos describen cómo aplicar el OCR para recibos con Python. Cree una instancia del objeto Aspose.Ocr, inicialice el objeto OcrInput para almacenar los recibos y cree el objeto ReceiptRecognitionSettings para definir los parámetros para el OCR de las facturas. Por último, llame al método perceive_receipt() proporcionando la lista de recibos y la configuración para extraer el texto.
Código para la extracción de datos de facturas mediante Python
Este código de muestra demuestra el uso de la API de OCR de facturas con Python. Puede configurar el tipo de entrada en PDF, TIFF, URL, Directorio, Zip, etc., y configurar el idioma de detección a partir de una gran lista de nombres de idiomas en el enumerador de idiomas. La clase ReceiptRecognitionSettings contiene una serie de propiedades, como la configuración del conjunto de caracteres permitidos, un indicador para configurar la inversión automática de color y definir una lista negra de caracteres para ignorarlos.
Este artículo nos ha enseñado el proceso de extracción de texto de facturas. Para convertir texto escrito a mano en texto editable y que se pueda buscar, consulte el artículo sobre Convertir escritura a mano en texto usando Python.