Dieses Tutorial erklärt, wie Sie Datenextraktion aus Rechnungen mit Python durchführen. Es enthält alle Details zum Einrichten der IDE für die Entwicklung, eine Liste von Schritten, die den Programmablauf definieren, und einen Beispielcode, der die Rechnungs-OCR-Software mit Python demonstriert. Sie lernen, den Erkennungsprozess von Bildern wie PNG, JPEG, BMP, TIFF und GIF nach Ihren Anforderungen anzupassen.
Schritte zur Rechnungs-OCR mit Python
- Legen Sie die Umgebung so fest, dass Aspose.OCR for Python via .NET zum Extrahieren von Rechnungsdaten verwendet wird.
- Erstellen Sie eine Instanz von Aspose.Ocr für die OCR-Verarbeitung
- Erstellen Sie eine Instanz der OcrInput-Klasse zum Aufbewahren von Belegen
- Belege zur OcrInput-Sammlung hinzufügen
- Einrichten der Belegerkennungseinstellungen und Festlegen der Erkennungssprache
- Führen Sie OCR mit der Methode recognize_receipt durch, um Text aus den Eingabebelegen zu erkennen
- Erkannten Text aus den Belegen anzeigen
Diese Schritte beschreiben, wie Sie OCR für Quittungen mit Python anwenden. Erstellen Sie eine Instanz des Aspose.Ocr-Objekts, initialisieren Sie das OcrInput-Objekt zum Aufbewahren von Quittungen und erstellen Sie das ReceiptRecognitionSettings-Objekt zum Definieren der Parameter für die OCR der Rechnungen. Rufen Sie abschließend die Methode recognize_receipt() auf, indem Sie die Quittungsliste und die Einstellungen zum Extrahieren des Textes angeben.
Code zur Rechnungsdatenextraktion mit Python
Dieser Beispielcode demonstriert die Verwendung der Rechnungs-OCR-API mit Python. Sie können den Eingabetyp auf PDF, TIFF, URL, Verzeichnis, Zip usw. einstellen und die Erkennungssprache aus einer großen Liste von Sprachennamen im Sprachen-Enumerator auswählen. Die Klasse ReceiptRecognitionSettings enthält eine Reihe von Eigenschaften, wie z. B. das Festlegen des zulässigen Zeichensatzes, ein Flag zum Festlegen der automatischen Farbumkehrung und das Definieren einer schwarzen Liste von Zeichen, die ignoriert werden sollen.
In diesem Artikel haben wir gelernt, wie man Rechnungstext extrahiert. Informationen zum Konvertieren von handschriftlichem Text in bearbeitbaren und durchsuchbaren Text finden Sie im Artikel zu Konvertieren Sie Handschrift mit Python in Text.