Tento stručný průvodce popisuje, jak extrahovat text z PowerPointu pomocí C#. Obsahuje podrobnosti o nastavení IDE, seznam kroků a ukázkový kód pro vývoj PowerPoint na textový konvertér pomocí C#. Naučíte se přistupovat k různému obsahu v prezentaci/slajdech pro získání textu z ní.
Kroky pro převod PowerPointu na text pomocí C#
- Nastavte prostředí tak, aby používalo Aspose.Slides for .NET pro převod PPTX na TXT
- Otevřete soubor PPTX do paměti pomocí třídy Presentation, s použitím definované vstupní cesty souboru
- Zavolejte metodu SlideUtil.GetAllTextFrames() pro extrahování všech textových rámců z každého snímku
- Nastavte příznak pro extrakci textových rámců z hlavních a rozvrhových snímků, také.
- Deklarujte objekt StringBuilder pro uchování extrahovaného textového obsahu
- Zpracujte každý textový rámec a přistupujte k jeho odstavcům
- Procházejte každý odstavec a přidávejte jeho textové části do nových řádků ve StringBuilderu
- Zapište finální nahromaděný text do souboru TXT na disku
Tyto kroky vysvětlují vývoj konvertoru PPTX na text pomocí C#. Načtěte prezentaci, získejte kolekci všech textových rámců, vytvořte objekt StringBuilder a iterujte přes každý rámec v kolekci. Pro každý rámec přistupte ke kolekci odstavců, v každém odstavci získejte kolekci částí, načtěte text z části a přidejte jej k objektu StringBuilder.
Kód pro převod PPTX na TXT pomocí C#
Tento kód ukazuje, jak extrahovat text z PPTX pomocí C#. Existuje další rychlý způsob, jak získat text z celé prezentace pomocí PresentationFactory.Instance. Metoda GetPresentationText(inputPath, TextExtractionArrangingMode.Neuspořádaně) zapisuje obsah každého snímku do výstupního souboru kódovaného v UTF‑8. Pro každý snímek budou zapsány čtyři textové komponenty, včetně hlavního těla textu, poznámek přednášejícího, textu hlavního snímku a textu rozvržení.
Tento článek nás naučil, jak extrahovat veškerý text z prezentace. Pro převod PowerPointu na video MP4 si přečtěte článek Convert PowerPoint to Video using C#.