استخراج النص من PowerPoint باستخدام Python

هذا الدليل القصير يصف كيفية استخراج النص من PowerPoint باستخدام بايثون. يحتوي على تفاصيل لإعداد بيئة التطوير المتكاملة، قائمة بالخطوات، وعينة كود لـ تحويل PowerPoint إلى نص باستخدام بايثون. سيتم مناقشة تقنيات مختلفة لجلب النص من الشرائح.

خطوات استخراج النص من PPTX باستخدام بايثون

  1. اضبط الـ IDE لاستخدام Aspose.Slides for Python via .NET لاستخراج النص
  2. استورد الفئات المطلوبة من المكتبة وفئة الأداة SlideUtil
  3. حدد مسارات ملفات الإدخال/الإخراج وحمّل الترخيص
  4. تحميل عرض PowerPoint المصدر إلى كائن Presentation
  5. استخدم SlideUtil.get_all_text_frames لاستخراج جميع إطارات النص من كل شريحة
  6. المرور عبر جميع إطارات النص وفقاراتها لجمع أجزاء النص الفردية
  7. عالج كل إطار وأضف محتويات الشريحة في سطر جديد
  8. احفظ جميع أجزاء النص المجمعة واحفظ الناتج في ملف TXT

توضح هذه الخطوات العملية لتطوير محول PPTX إلى نص باستخدام بايثون. قم بتحميل العرض التقديمي، احصل على جميع إطارات النص منه، حلل كل فقرة في جميع الإطارات، واستخرج النص من الأجزاء الموجودة فيها. احفظ جميع البيانات المجمعة في ملف نصي مع فاصل سطر لكل مقطع نصي.

الكود لتحويل PowerPoint إلى نص باستخدام Python

يعرض هذا الكود كيفية تحويل PPTX إلى TXT باستخدام بايثون. بدلاً من مسح العرض التقديمي بالكامل مرة واحدة، يمكنك الوصول إلى كل شريحة على حدة ومعالجتها لجلب النص من الشرائح المحددة فقط. خيار آخر هو عدم تحميل العرض التقديمي في الذاكرة واستخدام مسار الملف فقط لاستخراج نصه مع علامة لسحب النص بالترتيب المرتب، كالأصلي أو بترتيب مسطح.

هذا المقال القصير يوضح كيفية استخراج النص من ملف PPTX. لتحويل العرض التقديمي إلى فيديو، راجع المقال تحويل PowerPoint إلى فيديو باستخدام Python.

 عربي