Java를 사용하여 PDF에서 Excel로 표 추출

이 빠른 가이드는 Java를 사용하여 PDF에서 Excel까지 테이블을 추출하는 방법을 설명합니다. 환경 설정 정보, 단계 목록 및 Java를 사용하여 PDF에서 Excel로 테이블을 가져오는 샘플 코드를 얻을 수 있습니다. 모든 필요한 세부 사항이 제공되어 PDF 페이지의 모든 테이블에 접근하고, 모든 셀의 텍스트에 접근하며, 내용을 출력 워크북의 해당 셀에 복사할 수 있습니다.

Java를 사용하여 PDF에서 Excel로 표 추출 단계

  1. PDF 테이블을 Excel 시트로 추출하기 위해 Aspose.Total for Java를 사용하도록 환경을 설정합니다.
  2. Aspose.PDF와 Aspose.Cells 제품에 Aspose.Total 라이선스를 적용합니다.
  3. 소스 PDF 파일을 Document 클래스 객체에 로드합니다
  4. Aspose.Cells의 Workbook 클래스를 사용하여 빈 Excel 파일을 생성합니다.
  5. PDF의 각 페이지를 순회하고 각 페이지의 테이블 컬렉션에 접근합니다.
  6. 모든 페이지를 순회하며 각 셀에 하나씩 접근합니다
  7. 각 셀에서 텍스트를 가져와 대상 시트의 해당 행과 열에 내용을 저장합니다.
  8. 시트의 열을 자동 맞춤하고 출력 Excel 파일을 저장합니다.

다음 단계에 따라 Java를 사용하여 PDF에서 Excel로 표를 가져오기를 수행하십시오. 소스 PDF 파일을 로드하고, 모든 페이지에 접근한 뒤, 각 페이지를 별도로 파싱하고, 각 페이지의 표 컬렉션을 가져오며, 선택된 표의 각 셀에 접근합니다. 셀 내부의 텍스트를 문자열로 결합하고, 출력 Excel 파일의 해당 시트에서 해당 행과 열에 내용을 저장합니다.

Java를 사용하여 PDF에서 Excel 테이블 추출하기

이 코드는 Java를 사용하여 PDF 테이블에서 Excel로 데이터를 추출하는 방법을 보여줍니다. PDF 테이블 셀 색상, 굵게/기울임 스타일, 글꼴 이름 및 크기를 가져와 Excel 셀에 동일하게 설정함으로써 원본 PDF 텍스트 형식을 Excel 시트 테이블에 적용할 수 있습니다. PDF의 병합된 테이블을 처리하고 Excel 파일에 동일하게 생성할 때 테이블 내용의 구성을 동일하게 유지하도록 주의하십시오.

이 문서는 PDF 표에서 Excel 시트 표로 텍스트를 복사하는 과정을 가르칩니다. 스캔된 PDF를 편집 가능한 PDF로 변환하려면, 기사 Java를 사용하여 스캔된 PDF를 편집 가능한 PDF로 변환를 참조하십시오.

 한국인