Ekstrakcja danych z faktur przy użyciu Pythona

Ten samouczek pokazuje, jak wykonać ekstrakcję danych z faktur przy użyciu Pythona. Zawiera wszystkie szczegóły dotyczące konfiguracji IDE do rozwoju, listę kroków definiujących przepływ programu oraz przykładowy kod demonstrujący oprogramowanie OCR faktur przy użyciu Pythona. Nauczysz się dostosowywać proces wykrywania z obrazów, takich jak PNG, JPEG, BMP, TIFF i GIF zgodnie ze swoimi wymaganiami.

Kroki rozpoznawania faktur za pomocą języka Python

  1. Ustaw środowisko tak, aby używało Aspose.OCR for Python via .NET do wyodrębniania danych z faktury
  2. Utwórz wystąpienie Aspose.Ocr do przetwarzania OCR
  3. Utwórz instancję klasy OcrInput do przechowywania paragonów
  4. Dodaj paragony do kolekcji OcrInput
  5. Skonfiguruj ustawienia rozpoznawania paragonów i ustaw język rozpoznawania
  6. Wykonaj OCR za pomocą metody recognize_receipt, aby rozpoznać tekst z potwierdzeń wejściowych
  7. Wyświetl rozpoznany tekst z paragonów

Te kroki opisują, jak zastosować OCR dla paragonów przy użyciu Pythona. Utwórz wystąpienie obiektu Aspose.Ocr, zainicjuj obiekt OcrInput do przechowywania paragonów i utwórz obiekt ReceiptRecognitionSettings do definiowania parametrów dla OCR faktur. Na koniec wywołaj metodę recognize_receipt(), podając listę paragonów i ustawienia do wyodrębnienia tekstu.

Kod do ekstrakcji danych z faktury za pomocą Pythona

Ten przykładowy kod demonstruje użycie invoice OCR API przy użyciu Pythona. Możesz ustawić typ wejściowy na PDF, TIFF, URL, Directory, Zip itd. i ustawić język wykrywania z długiej listy nazw języków w enumeratorze Language. Klasa ReceiptRecognitionSettings zawiera szereg właściwości, takich jak ustawienie zestawu dozwolonych znaków, flagę do ustawienia automatycznej inwersji kolorów i zdefiniowanie czarnej listy znaków do ich ignorowania.

Ten artykuł nauczył nas procesu ekstrakcji tekstu faktury. Aby przekonwertować tekst pisany ręcznie na tekst edytowalny i przeszukiwalny, zapoznaj się z artykułem na temat Konwersja pisma odręcznego na tekst za pomocą Pythona.

 Polski