C#를 사용하여 PowerPoint에서 텍스트 추출

이 짧은 가이드는 C#을 사용하여 PowerPoint에서 텍스트를 추출하는 방법을 설명합니다. IDE 설정 방법, 단계 목록, 그리고 PowerPoint을 텍스트 변환기로 개발하기 위한 샘플 코드가 포함되어 있습니다. 프레젠테이션/슬라이드의 다양한 콘텐츠에 접근하여 텍스트를 가져오는 방법을 배울 수 있습니다.

C#를 사용하여 PowerPoint를 텍스트로 변환하는 단계

  1. 환경을 설정하여 Aspose.Slides for .NET을 사용해 PPTX를 TXT로 변환합니다.
  2. 정의된 입력 파일 경로를 사용하여 Presentation 클래스를 이용해 PPTX 파일을 메모리로 엽니다.
  3. 모든 슬라이드에서 모든 텍스트 프레임을 추출하기 위해 SlideUtil.GetAllTextFrames() 메서드를 호출합니다.
  4. 마스터 및 레이아웃 슬라이드에서 텍스트 프레임을 추출하도록 플래그를 설정합니다, 또한
  5. 추출된 텍스트 내용을 보관하기 위한 StringBuilder 객체 선언
  6. 각 텍스트 프레임을 구문 분석하고 해당 단락에 접근합니다
  7. 각 단락을 순회하면서 텍스트 부분을 새 줄에 StringBuilder에 추가합니다.
  8. 디스크에 TXT 파일로 최종 누적 텍스트를 기록합니다

이 단계들은 C#를 사용한 PPTX 텍스트 변환기의 개발을 설명합니다. 프레젠테이션을 로드하고, 모든 텍스트 프레임의 컬렉션을 가져온 다음, StringBuilder 객체를 생성하고 컬렉션의 각 프레임을 반복합니다. 각 프레임에 대해 단락 컬렉션에 접근하고, 각 단락에서 부분 컬렉션을 가져와 해당 부분의 텍스트를 추출한 뒤 StringBuilder 객체에 추가합니다.

C#를 사용하여 PPTX를 TXT로 변환하는 코드

이 코드는 C#를 사용하여 PPTX에서 텍스트를 추출하는 방법을 보여줍니다. PresentationFactory.Instance.GetPresentationText(inputPath, TextExtractionArrangingMode) 메서드.Unarranged) 메서드는 각 슬라이드의 내용을 UTF-8 인코딩된 출력 파일에 기록합니다. 각 슬라이드마다 본문 텍스트, 발표자 노트, 마스터 슬라이드 텍스트, 레이아웃 텍스트를 포함한 네 가지 텍스트 구성 요소가 기록됩니다.

이 문서는 프레젠테이션에서 모든 텍스트를 추출하는 방법을 알려주었습니다. PowerPoint를 MP4 비디오로 변환하려면, 기사 Convert PowerPoint to Video using C#를 참조하십시오.

 한국인