Ovaj vodič vodi o tome kako izvesti izdvajanje podataka iz faktura pomoću Pythona. Sadrži sve pojedinosti za postavljanje IDE-a za razvoj, popis koraka koji definiraju tok programa i primjer koda koji demonstrira softver OCR za fakture pomoću Pythona. Naučit ćete prilagoditi proces otkrivanja iz slika kao što su PNG, JPEG, BMP, TIFF i GIF prema vašim zahtjevima.
Koraci za OCR fakture pomoću Pythona
- Postavite okruženje da koristi Aspose.OCR for Python via .NET za izdvajanje podataka fakture
- Napravite instancu Aspose.Ocr za OCR obradu
- Stvorite instancu klase OcrInput za držanje računa
- Dodajte račune u kolekciju OcrInput
- Postavite postavke prepoznavanja računa i postavite jezik prepoznavanja
- Izvršite OCR korištenjem metode recognize_receipt za prepoznavanje teksta s potvrda o unosu
- Prikaz prepoznatog teksta s računa
Ovi koraci opisuju kako primijeniti OCR za račune pomoću Pythona. Stvorite instancu objekta Aspose.Ocr, inicijalizirajte objekt OcrInput za čuvanje računa i stvorite objekt ReceiptRecognitionSettings za definiranje parametara za OCR faktura. Na kraju, pozovite metodu accept_receipt() pružanjem popisa računa i postavki za izdvajanje teksta.
Kod za ekstrakciju podataka fakture pomoću Pythona
Ovaj primjer koda demonstrira korištenje invoice OCR API-ja pomoću Pythona. Možete postaviti vrstu unosa na PDF, TIFF, URL, Imenik, Zip itd. i postaviti jezik otkrivanja s velikog popisa naziva jezika u popisivaču jezika. Klasa ReceiptRecognitionSettings sadrži niz svojstava kao što je postavljanje dozvoljenog skupa znakova , označite za postavljanje automatske inverzije boja i definirajte crni popis znakova za njihovo ignoriranje.
Ovaj nas je članak naučio postupku izdvajanja teksta fakture. Za pretvaranje rukom pisanog teksta u tekst koji se može uređivati i pretraživati, pogledajte članak na Pretvorite rukopis u tekst pomoću Pythona.