이 튜토리얼은 스캔한 PDF을 Python을 사용하여 편집 가능한 PDF로 변환하는 방법을 설명합니다. IDE 설정 방법, 단계 목록 및 Python을 사용하여 PDF를 읽을 수 있게 만드는 샘플 코드를 포함하고 있습니다. API가 제공하는 다양한 매개변수를 설정하여 인식 맞춤화를 배우게 됩니다.
Python을 사용하여 PDF를 검색 가능한 PDF로 변환하는 단계
- IDE를 Aspose.OCR for Python via Java을 사용하도록 설정하여 PDF를 스캔합니다.
- 라이브러리를 가져오고 라이선스를 초기화합니다
- AsposeOcr 클래스 객체를 사용하여 인식 엔진을 생성합니다
- 스캔한 PDF를 사용하여 입력을 구성하기 위해 OcrInput 객체를 인스턴스화합니다.
- 스캔 과정을 제어하는 매개변수를 설정하여 RecognitionSettings 객체를 정의합니다.
- 입력 객체와 인식 설정을 전달하여 engine.recognize() 메서드를 호출합니다.
- 결과를 최대 품질의 PDF로 저장합니다
이 단계에서는 Python을 사용한 PDF 이미지에서 PDF 텍스트로 변환하는 방법을 설명합니다. AsposeOcr 클래스를 사용하여 인식 엔진을 인스턴스화하고, OcrInput 객체를 사용하여 입력을 정의하며, 원하는 매개변수를 설정하기 위해 RecognitionSettings 객체를 인스턴스화합니다. 마지막으로 recognize() 메서드를 호출하여 PDF 파일을 스캔하고, save_pdf() 메서드를 사용하여 인식 프로세스의 결과를 PDF 파일로 저장합니다.
Python을 사용하여 PDF 그림을 텍스트로 변환하는 코드
번역할 문장이 제공되지 않았습니다.
이 샘플 코드는 Python을 사용하여 스캔된 PDF를 검색 가능한 PDF로 변환하는 방법을 보여줍니다. save_pdf() 메서드는 PDF 배경을 그대로 렌더링하고 스캔된 텍스트를 그 위에 배치합니다. 개발자는 감지 언어, 감지 영역, 정확도 수준 및 성능과 같은 매개변수를 설정할 수 있습니다.
이 문서는 스캔된 PDF를 읽을 수 있는 PDF로 변환하는 과정을 알려주었습니다. 인보이스에서 데이터를 추출하려면, 기사 Python을 사용한 인보이스 데이터 추출를 참조하십시오.