این راهنمای کوتاه توضیح میدهد که چگونه متن را از PowerPoint با استفاده از C# استخراج کنید. شامل جزئیاتی برای تنظیم IDE، فهرستی از مراحل، و یک کد نمونه برای توسعه یک PowerPoint به تبدیلکننده متن با استفاده از C# است. شما یاد خواهید گرفت که به محتوای مختلف در ارائه/اسلایدها دسترسی پیدا کنید تا متن را از آن استخراج کنید.
مراحل تبدیل پاورپوینت به متن با استفاده از C#
- محیط را برای استفاده از Aspose.Slides for .NET جهت تبدیل PPTX به TXT تنظیم کنید
- فایل PPTX را بهصورت در حافظه باز کنید با استفاده از کلاس Presentation، با استفاده از مسیر فایل ورودی تعریفشده
- متد SlideUtil.GetAllTextFrames() را برای استخراج تمام فریمهای متن از هر اسلاید فراخوانی کنید
- پرچم را برای استخراج فریمهای متنی از اسلایدهای مستر و لایه تنظیم کنید، همچنین
- شیء StringBuilder را برای نگهداری محتوای متن استخراجشده اعلام کنید
- هر فریم متنی را تجزیه کنید و به پاراگرافهای آن دسترسی پیدا کنید
- برای هر پاراگراف حلقه بزنید و بخشهای متنی آن را در خطوط جدید به StringBuilder اضافه کنید
- متن نهایی انباشته شده را در یک فایل TXT روی دیسک بنویسید
این مراحل توسعه مبدل PPTX به متن با استفاده از C# را توضیح میدهند. ارائه را بارگذاری کنید، مجموعهٔ تمام فریمهای متنی را دریافت کنید، یک شیء StringBuilder ایجاد کنید و در هر فریم در مجموعه تکرار کنید. برای هر فریم، به مجموعهٔ پاراگرافها دسترسی پیدا کنید، در هر پاراگراف، مجموعهٔ بخشها را دریافت کنید، متن را از بخش استخراج کنید و به شیء StringBuilder اضافه کنید.
کد برای تبدیل PPTX به TXT با استفاده از C#
این کد نشان میدهد چگونه متن را از PPTX با استفاده از C# استخراج کنیم. روش سریع دیگری برای دریافت متن از کل ارائه با استفاده از PresentationFactory.Instance.متد GetPresentationText(inputPath, TextExtractionArrangingMode)Unarranged) محتویات هر اسلاید را در یک فایل خروجی با رمزگذاری UTF-8 مینویسد. چهار مؤلفه متنی برای هر اسلاید نوشته میشود، شامل متن اصلی بدنه، یادداشتهای سخنران، متن اسلاید اصلی و متن طرحبندی.
این مقاله به ما آموخت که چگونه تمام متن را از یک ارائه استخراج کنیم. برای تبدیل یک پاورپوینت به ویدیو MP4، به مقاله تبدیل پاورپوینت به ویدیو با استفاده از C# مراجعه کنید.