Python을 사용하여 PowerPoint에서 텍스트 추출

이 짧은 가이드는 Python을 사용하여 PowerPoint에서 텍스트를 추출하는 방법을 설명합니다. IDE 설정에 대한 세부 정보, 단계 목록 및 Python을 사용하여 PowerPoint를 텍스트로 변환하는 샘플 코드가 포함되어 있습니다. 슬라이드에서 텍스트를 가져오는 다양한 기술이 논의될 것입니다.

Python을 사용하여 PPTX에서 텍스트 추출 단계

  1. IDE를 Aspose.Slides for Python via .NET을 사용하도록 설정하여 텍스트를 추출합니다.
  2. 라이브러리와 SlideUtil 유틸리티 클래스에서 원하는 클래스를 가져옵니다.
  3. 입력/출력 파일 경로를 정의하고 라이선스를 로드합니다.
  4. 소스 PowerPoint 프레젠테이션을 Presentation 객체에 로드합니다.
  5. 모든 슬라이드에서 모든 텍스트 프레임을 추출하기 위해 SlideUtil.get_all_text_frames를 사용하십시오.
  6. 모든 텍스트 프레임과 해당 단락을 파싱하여 개별 텍스트 부분을 수집합니다
  7. 각 프레임을 처리하고 슬라이드 내용을 새 줄에 추가합니다
  8. 수집된 모든 텍스트 부분을 저장하고 출력물을 TXT 파일에 저장합니다.

이 단계들은 Python을 사용한 PPTX 텍스트 변환기 개발 과정을 설명합니다. 프레젠테이션을 로드하고, 모든 텍스트 프레임을 가져온 뒤, 각 프레임의 모든 단락을 파싱하고, 그 안의 부분 텍스트를 추출합니다. 수집된 모든 데이터를 각 텍스트 구간마다 줄 구분자를 넣은 텍스트 파일에 저장합니다.

Python을 사용한 PowerPoint 텍스트 변환기 코드

이 코드는 Python을 사용하여 PPTX를 TXT로 변환하는 방법을 보여줍니다. 전체 프레젠테이션을 한 번에 스캔하는 대신, 각 슬라이드에 개별적으로 접근하여 선택된 슬라이드에서만 텍스트를 가져오도록 처리할 수 있습니다. 또 다른 옵션은 프레젠테이션을 메모리에 로드하지 않고 파일 경로만 사용하여 텍스트를 추출하는 것으로, 플래그를 사용해 원본 순서대로 또는 평면 순서대로 텍스트를 가져올 수 있습니다.

이 짧은 기사에서는 PPTX에서 텍스트를 추출하는 방법을 안내합니다. 프레젠테이션을 비디오로 변환하려면, 기사 파이썬을 사용하여 PowerPoint를 비디오로 변환를 참조하세요.

 한국인