استخراج متن از پاورپوینت با استفاده از جاوا

این آموزش کوتاه توضیح می‌دهد که چگونه با استخراج متن از PowerPoint با استفاده از Java. جزئیاتی برای تنظیم IDE، فهرستی از مراحل، و یک کد نمونه برای توسعه مبدل PowerPoint به متن با استفاده از Java ارائه می‌شود. گزینه‌های مختلف برای استخراج متن از ارائه مورد بحث قرار خواهد گرفت.

مراحل استخراج تمام متن از پاورپوینت با استفاده از جاوا

  1. محیط را تنظیم کنید تا از Aspose.Slides for Java برای تبدیل PPTX به TXT استفاده شود
  2. وابستگی‌های مورد نیاز برای تجزیه اسلاید و خروجی فایل را وارد کنید
  3. با استفاده از کلاس Presentation، فایل PPTX منبع را در حافظه بارگذاری کنید
  4. تمام فریم‌های متن را بازیابی کنید تا هر محفظه متن را از تمام slides جمع‌آوری کنید.
  5. از تمام پاراگراف‌ها و بخش‌های فریم‌ها عبور کنید و متن را به شیء StringBuilder اضافه کنید
  6. فایل خروجی را به‌صورت فایل TXT ذخیره کنید

مراحل ذکر شده در بالا، فرآیند استخراج متن از PPTX با استفاده از جاوا را خلاصه می‌کند. ارائه را بارگذاری کنید، به تمام فریم‌های متنی دسترسی پیدا کنید، یک شیء StringBuilder ایجاد کنید و از طریق تمام فریم‌ها برای دریافت پاراگراف‌ها تکرار کنید. از هر پاراگراف، بخش‌ها را دریافت کنید، متن هر بخش را استخراج کنید و به نمونه StringBuilder اضافه کنید، و در نهایت متن جمع‌آوری‌شده را در یک فایل TXT ذخیره کنید.

کد برای تبدیل PPTX به TXT با استفاده از جاوا

این کد نشان می‌دهد که چگونه می‌توان PowerPoint را با استفاده از Java به متن تبدیل کرد . می‌توانید متن را اسلاید به اسلاید با استفاده از متد SlideUtil.getAllTextBoxes() که یک اسلاید را به عنوان ورودی می‌گیرد استخراج کنید، و یادداشت‌های سخنران را با استفاده از متد slide.getNotesSlideManager().getNotesSlide() استخراج کنید، و متن را از جداول با استفاده از slide.getShapes() که مجموعه اشکال را برمی‌گرداند و هر شکلی که نمونه‌ای از ITable است فیلتر کنید. خروجی JSON نیز می‌تواند با پر کردن JsonObject و ذخیره داده‌ها در یک JSONArray تولید شود.

این مقاله فرآیند تبدیل PowerPoint به متن را توضیح می‌دهد. برای تبدیل یک ارائه به ویدیو، به مقاله تبدیل PowerPoint به ویدیو با استفاده از Java مراجعه کنید.

 فارسی