이 튜토리얼은 Python을 사용하여 송장에서 데이터 추출을 수행하는 방법을 안내합니다. 개발을 위한 IDE를 설정하는 모든 세부 정보, 프로그램 흐름을 정의하는 단계 목록, Python을 사용하여 송장 OCR 소프트웨어를 보여주는 샘플 코드가 있습니다. 요구 사항에 따라 PNG, JPEG, BMP, TIFF 및 GIF와 같은 이미지에서 감지 프로세스를 사용자 정의하는 방법을 배우게 됩니다.
Python을 사용한 송장 OCR 단계
- Aspose.OCR for Python via .NET를 사용하여 송장 데이터 추출 환경을 설정합니다.
- OCR 처리를 위한 Aspose.Ocr 인스턴스를 생성합니다.
- 영수증을 보관하기 위한 OcrInput 클래스 인스턴스를 생성합니다.
- OcrInput 컬렉션에 영수증 추가
- 영수증 인식 설정 및 인식 언어 설정
- recognize_receipt 방법을 사용하여 OCR을 수행하여 입력 영수증의 텍스트를 인식합니다.
- 영수증에서 인식된 텍스트를 표시합니다.
이 단계에서는 Python을 사용하여 영수증에 OCR을 적용하는 방법을 설명합니다. Aspose.Ocr 객체의 인스턴스를 만들고, 영수증을 보관하기 위한 OcrInput 객체를 초기화하고, 송장 OCR에 대한 매개변수를 정의하기 위한 ReceiptRecognitionSettings 객체를 만듭니다. 마지막으로 영수증 목록과 텍스트 추출 설정을 제공하여 perceive_receipt() 메서드를 호출합니다.
Python을 사용한 송장 데이터 추출을 위한 코드
이 샘플 코드는 Python을 사용한 invoice OCR API의 사용법을 보여줍니다. 입력 유형을 PDF, TIFF, URL, Directory, Zip 등으로 설정하고 Language 열거자의 언어 이름 목록에서 감지 언어를 설정할 수 있습니다. ReceiptRecognitionSettings 클래스에는 허용 문자 집합 설정, 자동 색상 반전을 설정하는 플래그, 무시할 문자의 블랙 리스트 정의와 같은 여러 속성이 포함되어 있습니다.
이 문서에서는 송장 텍스트를 추출하는 프로세스를 알려드렸습니다. 손으로 쓴 텍스트를 편집 및 검색 가능한 텍스트로 변환하려면 Python을 사용하여 필기체를 텍스트로 변환의 문서를 참조하세요.