이 항목에서는 구성 단계 및 실행 가능한 샘플 코드의 도움으로 Python의 PDF에서 이미지를 가져오는 방법에 대해 자세히 설명합니다. Python의 PDF에서 이미지를 PNG, JPEG 등과 같은 다양한 형식으로 가져오는 데 필요한 모든 필수 클래스와 메서드가 제공되므로 이 애플리케이션을 개발하는 데 활용할 수 있는 완전한 프로그램 코드가 공유됩니다. 또한 PDF 파일에서 이미지에 액세스한 후 생성된 이미지를 사용자 지정하여 프로세스를 향상시키는 다양한 옵션을 관찰합니다.
Python에서 PDF 이미지를 얻는 단계
- .NET을 통한 Python용 Aspose.PDF를 사용하여 PDF에서 이미지를 추출하도록 IDE 구성
- Document 클래스 개체를 사용하여 내부에 이미지가 있는 소스 PDF 파일에 액세스
- XImage 클래스 개체를 사용하여 페이지 리소스 내의 특정 이미지에 액세스
- 원하는 이미지의 이름을 사용하여 새 파일 스트림 생성
- 이미지를 디스크에 JPEG 파일로 저장
이 단계는 먼저 소스 PDF 파일을 연 다음 PDF 내의 특정 페이지에 액세스하는 단계별 접근 방식을 노출하여 Python에서 PDF에서 이미지를 가져오는 방법을 수반합니다. 각 PDF 페이지에는 색인을 통해 참조할 수 있는 이미지를 포함한 리소스 모음이 있습니다. XImage 클래스 개체의 인스턴스를 사용하여 필요한 이미지 참조에 액세스하면 메모리 스트림의 인스턴스를 사용하여 디스크에 이미지로 저장할 수 있습니다.
Python의 PDF에서 이미지를 가져오는 코드
이 코드는 Document 클래스 개체에 액세스한 다음 리소스 목록에 액세스하여 특정 페이지에서 원하는 이미지에 액세스하여 로드하여 Python에서 PDF에서 이미지를 가져오는 절차를 보여줍니다. 원하는 이미지에 액세스하면 이름을 바꿀 수 있고 문서 내의 참조를 변경할 수도 있습니다. 디스크에 파일로 저장하기 전에 이름, 너비, 높이와 같은 다양한 속성에 액세스하여 이미지를 필터링할 수도 있습니다.
이 예제는 PDF 페이지에서 이미지를 추출하도록 안내했습니다. PDF 파일에 워터마크를 추가하는 과정에 대해 알아보려면 Python에서 PDF에 워터마크를 추가하는 방법의 문서를 참조하세요.