Extrahovat text z PowerPointu pomocí C#

Tento stručný průvodce popisuje, jak extrahovat text z PowerPointu pomocí C#. Obsahuje podrobnosti o nastavení IDE, seznam kroků a ukázkový kód pro vývoj PowerPoint na textový konvertér pomocí C#. Naučíte se přistupovat k různému obsahu v prezentaci/slajdech pro získání textu z ní.

Kroky pro převod PowerPointu na text pomocí C#

  1. Nastavte prostředí tak, aby používalo Aspose.Slides for .NET pro převod PPTX na TXT
  2. Otevřete soubor PPTX do paměti pomocí třídy Presentation, s použitím definované vstupní cesty souboru
  3. Zavolejte metodu SlideUtil.GetAllTextFrames() pro extrahování všech textových rámců z každého snímku
  4. Nastavte příznak pro extrakci textových rámců z hlavních a rozvrhových snímků, také.
  5. Deklarujte objekt StringBuilder pro uchování extrahovaného textového obsahu
  6. Zpracujte každý textový rámec a přistupujte k jeho odstavcům
  7. Procházejte každý odstavec a přidávejte jeho textové části do nových řádků ve StringBuilderu
  8. Zapište finální nahromaděný text do souboru TXT na disku

Tyto kroky vysvětlují vývoj konvertoru PPTX na text pomocí C#. Načtěte prezentaci, získejte kolekci všech textových rámců, vytvořte objekt StringBuilder a iterujte přes každý rámec v kolekci. Pro každý rámec přistupte ke kolekci odstavců, v každém odstavci získejte kolekci částí, načtěte text z části a přidejte jej k objektu StringBuilder.

Kód pro převod PPTX na TXT pomocí C#

Tento kód ukazuje, jak extrahovat text z PPTX pomocí C#. Existuje další rychlý způsob, jak získat text z celé prezentace pomocí PresentationFactory.Instance. Metoda GetPresentationText(inputPath, TextExtractionArrangingMode.Neuspořádaně) zapisuje obsah každého snímku do výstupního souboru kódovaného v UTF‑8. Pro každý snímek budou zapsány čtyři textové komponenty, včetně hlavního těla textu, poznámek přednášejícího, textu hlavního snímku a textu rozvržení.

Tento článek nás naučil, jak extrahovat veškerý text z prezentace. Pro převod PowerPointu na video MP4 si přečtěte článek Convert PowerPoint to Video using C#.

 Čeština