이 짧은 튜토리얼은 Java를 사용하여 PowerPoint에서 텍스트를 추출하는 방법을 설명합니다. IDE 설정 방법, 단계 목록, 그리고 Java를 사용한 PowerPoint 텍스트 변환기 개발을 위한 샘플 코드를 공유합니다. 프레젠테이션에서 텍스트를 추출하는 다양한 옵션에 대해 논의합니다.
Java를 사용하여 PowerPoint에서 모든 텍스트 추출 단계
- 환경을 설정하여 Aspose.Slides for Java을 사용해 PPTX를 TXT로 변환합니다.
- 슬라이드 파싱 및 파일 출력을 위한 종속성을 가져옵니다.
- Presentation 클래스를 사용하여 소스 PPTX 파일을 메모리로 로드합니다.
- 모든 텍스트 프레임을 검색하여 모든 slides의 텍스트 컨테이너를 모두 수집합니다.
- 모든 프레임의 단락과 부분을 파싱하고, StringBuilder 객체에 텍스트를 추가합니다.
- 출력 파일을 TXT 파일로 저장합니다
위에서 언급한 단계들은 Java를 사용하여 PPTX에서 텍스트를 추출하는 과정을 요약합니다. 프레젠테이션을 로드하고, 모든 텍스트 프레임에 접근한 뒤, StringBuilder 객체를 생성하고, 모든 프레임을 순회하며 단락을 가져옵니다. 각 단락에서 부분을 가져와 각 부분의 텍스트를 추출하고 StringBuilder 인스턴스에 추가한 다음, 최종적으로 누적된 텍스트를 TXT 파일로 저장합니다.
Java를 사용하여 PPTX를 TXT로 변환하는 코드
이 코드는 PowerPoint를 Java를 사용하여 텍스트로 변환하는 방법을 보여줍니다. 슬라이드를 입력으로 받는 SlideUtil.getAllTextBoxes() 메서드를 사용하여 슬라이드별로 텍스트를 추출할 수 있으며, slide.getNotesSlideManager().getNotesSlide() 메서드를 사용하여 발표자 노트를 추출하고, slide.getShapes()가 반환하는 도형 컬렉션에서 ITable 인스턴스인 각 도형을 필터링하여 표에서 텍스트를 추출할 수 있습니다. JsonObject를 채우고 JSONArray에 데이터를 저장하여 JSON 출력도 생성할 수 있습니다.
이 문서는 PowerPoint를 텍스트로 변환하는 과정을 설명합니다. 프레젠테이션을 비디오로 변환하려면, 기사 Java를 사용하여 PowerPoint를 비디오로 변환를 참조하십시오.