استخراج النص من PowerPoint باستخدام C#

هذا الدليل القصير يصف كيفية استخراج النص من PowerPoint باستخدام C#. يحتوي على تفاصيل لضبط بيئة التطوير المتكاملة، قائمة بالخطوات، وعينة كود لتطوير PowerPoint إلى محول نص باستخدام C#. ستتعلم كيفية الوصول إلى محتويات مختلفة في العرض/الشرائح لاستخراج النص منها.

خطوات تحويل PowerPoint إلى نص باستخدام C#

  1. اضبط البيئة لاستخدام Aspose.Slides for .NET لتحويل PPTX إلى TXT
  2. افتح ملف PPTX في الذاكرة باستخدام الفئة Presentation، باستخدام مسار ملف الإدخال المحدد
  3. استدعِ طريقة SlideUtil.GetAllTextFrames() لاستخراج جميع إطارات النص من كل شريحة
  4. اضبط العلامة لاستخراج إطارات النص من الشرائح الرئيسية وتخطيطات الشرائح، أيضًا
  5. أعلن عن كائن StringBuilder للاحتفاظ بمحتوى النص المستخرج
  6. تحليل كل إطار نصي والوصول إلى فقراته
  7. التنقل عبر كل فقرة وإلحاق أجزاء النص الخاصة بها في أسطر جديدة داخل StringBuilder
  8. اكتب النص المتراكم النهائي في ملف TXT على القرص

توضح هذه الخطوات تطوير محول PPTX إلى نص باستخدام C#. قم بتحميل العرض التقديمي، احصل على مجموعة جميع إطارات النص، أنشئ كائن StringBuilder، وتكرّر عبر كل إطار في المجموعة. لكل إطار، وصول إلى مجموعة الفقرات، في كل فقرة، احصل على مجموعة الأجزاء، استخرج النص من الجزء، وأضفه إلى كائن StringBuilder.

كود لتحويل PPTX إلى TXT باستخدام C#

يوضح هذا الكود كيفية استخراج النص من PPTX باستخدام C#. هناك طريقة سريعة أخرى لجلب النص من العرض التقديمي بالكامل باستخدام PresentationFactory.Instance. طريقة GetPresentationText(inputPath, TextExtractionArrangingMode.Unarranged) تكتب محتوى كل شريحة إلى ملف إخراج بترميز UTF-8. سيتم كتابة أربعة مكونات نصية لكل شريحة، بما في ذلك النص الأساسي، ملاحظات المتحدث، نص الشريحة الرئيسية، ونص التخطيط.

لقد علمنا هذا المقال كيفية استخراج كل النص من عرض تقديمي. لتحويل PowerPoint إلى فيديو MP4، راجع المقال تحويل PowerPoint إلى فيديو باستخدام C#.

 عربي