Wyodrębnianie tekstu z PowerPoint przy użyciu C#

Ten krótki przewodnik opisuje, jak wyodrębnić tekst z PowerPointa przy użyciu C#. Zawiera szczegóły dotyczące konfiguracji IDE, listę kroków oraz przykładowy kod do opracowania PowerPoint na konwerter tekstu przy użyciu C#. Dowiesz się, jak uzyskać dostęp do różnych treści w prezentacji/slajdach, aby pobrać z nich tekst.

Kroki konwersji PowerPoint na tekst przy użyciu C#

  1. Ustaw środowisko, aby używać Aspose.Slides for .NET do konwertowania PPTX na TXT
  2. Otwórz plik PPTX w pamięci, używając klasy Presentation, korzystając z określonej ścieżki pliku wejściowego
  3. Wywołaj metodę SlideUtil.GetAllTextFrames() w celu wyodrębnienia wszystkich ramek tekstowych z każdego slajdu
  4. Ustaw flagę, aby wyodrębnić ramki tekstowe z mastera i slajdów układu, także.
  5. Zadeklaruj obiekt StringBuilder do przechowywania wyodrębnionej treści tekstowej
  6. Przetwarzaj każdą ramkę tekstową i uzyskaj dostęp do jej akapitów
  7. Przejdź przez każdy akapit i dołącz jego fragmenty tekstu w nowych wierszach do StringBuildera
  8. Zapisz ostateczny zgromadzony tekst w pliku TXT na dysku

Te kroki wyjaśniają rozwój konwertera PPTX na tekst przy użyciu C#. Załaduj prezentację, pobierz kolekcję wszystkich ramek tekstowych, utwórz obiekt StringBuilder i iteruj przez każdą ramkę w kolekcji. Dla każdej ramki uzyskaj kolekcję akapitów, w każdym akapicie pobierz kolekcję fragmentów, pobierz tekst z fragmentu i dołącz go do obiektu StringBuilder.

Kod do konwersji PPTX na TXT przy użyciu C#

Ten kod demonstruje, jak wyodrębnić tekst z PPTX przy użyciu C#. Istnieje inny szybki sposób pobierania tekstu z całej prezentacji przy użyciu PresentationFactory.Instance. Metoda GetPresentationText(inputPath, TextExtractionArrangingMode.Nieuporządkowane) zapisuje zawartość każdego slajdu do pliku wyjściowego zakodowanego w UTF‑8. Dla każdego slajdu zostaną zapisane cztery komponenty tekstowe, w tym główny tekst, notatki prelegenta, tekst slajdu głównego i tekst układu.

Ten artykuł nauczył nas, jak wyodrębnić cały tekst z prezentacji. Aby przekonwertować PowerPoint na wideo MP4, odwołaj się do artykułu Konwertuj PowerPoint na wideo przy użyciu C#.

 Polski