Extrakce dat z faktur pomocí Pythonu

Tento návod popisuje, jak provádět extrakce dat z faktur pomocí Pythonu. Obsahuje všechny podrobnosti k nastavení IDE pro vývoj, seznam kroků definujících tok programu a ukázkový kód demonstrující fakturní OCR software využívající Python. Naučíte se přizpůsobit proces detekce z obrázků jako PNG, JPEG, BMP, TIFF a GIF podle vašich požadavků.

Kroky pro OCR faktury pomocí Pythonu

  1. Nastavte prostředí tak, aby k extrahování fakturačních údajů používalo Aspose.OCR for Python via .NET
  2. Vytvořte instanci Aspose.Ocr pro zpracování OCR
  3. Vytvořte instanci třídy OcrInput pro uchovávání účtenek
  4. Přidejte účtenky do kolekce OcrInput
  5. Nastavte nastavení rozpoznávání účtenek a nastavte jazyk rozpoznávání
  6. K rozpoznání textu ze vstupních účtenek proveďte OCR pomocí metody recognize_receipt
  7. Zobrazit rozpoznaný text z účtenek

Tyto kroky popisují, jak použít OCR pro účtenky pomocí Pythonu. Vytvořte instanci objektu Aspose.Ocr, inicializujte objekt OcrInput pro uchovávání účtenek a vytvořte objekt ReceiptRecognitionSettings pro definování parametrů pro OCR faktur. Nakonec zavolejte metodu rozpoznat_receipt() poskytnutím seznamu účtenek a nastavení pro extrakci textu.

Kód pro extrakci fakturačních dat pomocí Pythonu

Tento ukázkový kód ukazuje použití faktury OCR API pomocí Pythonu. Můžete nastavit typ vstupu na PDF, TIFF, URL, Directory, Zip atd. a nastavit jazyk detekce z velkého seznamu názvů jazyků v Enumerátoru jazyků. Třída ReceiptRecognitionSettings obsahuje řadu vlastností, jako je nastavení povolené sady znaků. , příznak pro nastavení automatické inverze barev a definování černé listiny znaků pro jejich ignorování.

Tento článek nás naučil proces extrahování textu faktury. Chcete-li převést ručně psaný text na upravitelný a prohledávatelný text, přečtěte si článek na Převeďte ručně psaný text na text pomocí Pythonu.

 Čeština