이 빠른 가이드는 Java를 사용하여 PDF에서 Excel까지 테이블을 추출하는 방법을 설명합니다. 환경 설정 정보, 단계 목록 및 Java를 사용하여 PDF에서 Excel로 테이블을 가져오는 샘플 코드를 얻을 수 있습니다. 모든 필요한 세부 사항이 제공되어 PDF 페이지의 모든 테이블에 접근하고, 모든 셀의 텍스트에 접근하며, 내용을 출력 워크북의 해당 셀에 복사할 수 있습니다.
Java를 사용하여 PDF에서 Excel로 표 추출 단계
- PDF 테이블을 Excel 시트로 추출하기 위해 Aspose.Total for Java를 사용하도록 환경을 설정합니다.
- Aspose.PDF와 Aspose.Cells 제품에 Aspose.Total 라이선스를 적용합니다.
- 소스 PDF 파일을 Document 클래스 객체에 로드합니다
- Aspose.Cells의 Workbook 클래스를 사용하여 빈 Excel 파일을 생성합니다.
- PDF의 각 페이지를 순회하고 각 페이지의 테이블 컬렉션에 접근합니다.
- 모든 페이지를 순회하며 각 셀에 하나씩 접근합니다
- 각 셀에서 텍스트를 가져와 대상 시트의 해당 행과 열에 내용을 저장합니다.
- 시트의 열을 자동 맞춤하고 출력 Excel 파일을 저장합니다.
다음 단계에 따라 Java를 사용하여 PDF에서 Excel로 표를 가져오기를 수행하십시오. 소스 PDF 파일을 로드하고, 모든 페이지에 접근한 뒤, 각 페이지를 별도로 파싱하고, 각 페이지의 표 컬렉션을 가져오며, 선택된 표의 각 셀에 접근합니다. 셀 내부의 텍스트를 문자열로 결합하고, 출력 Excel 파일의 해당 시트에서 해당 행과 열에 내용을 저장합니다.
Java를 사용하여 PDF에서 Excel 테이블 추출하기
이 코드는 Java를 사용하여 PDF 테이블에서 Excel로 데이터를 추출하는 방법을 보여줍니다. PDF 테이블 셀 색상, 굵게/기울임 스타일, 글꼴 이름 및 크기를 가져와 Excel 셀에 동일하게 설정함으로써 원본 PDF 텍스트 형식을 Excel 시트 테이블에 적용할 수 있습니다. PDF의 병합된 테이블을 처리하고 Excel 파일에 동일하게 생성할 때 테이블 내용의 구성을 동일하게 유지하도록 주의하십시오.
이 문서는 PDF 표에서 Excel 시트 표로 텍스트를 복사하는 과정을 가르칩니다. 스캔된 PDF를 편집 가능한 PDF로 변환하려면, 기사 Java를 사용하여 스캔된 PDF를 편집 가능한 PDF로 변환를 참조하십시오.