این آموزش کوتاه توضیح میدهد که چگونه با استخراج متن از PowerPoint با استفاده از Java. جزئیاتی برای تنظیم IDE، فهرستی از مراحل، و یک کد نمونه برای توسعه مبدل PowerPoint به متن با استفاده از Java ارائه میشود. گزینههای مختلف برای استخراج متن از ارائه مورد بحث قرار خواهد گرفت.
مراحل استخراج تمام متن از پاورپوینت با استفاده از جاوا
- محیط را تنظیم کنید تا از Aspose.Slides for Java برای تبدیل PPTX به TXT استفاده شود
- وابستگیهای مورد نیاز برای تجزیه اسلاید و خروجی فایل را وارد کنید
- با استفاده از کلاس Presentation، فایل PPTX منبع را در حافظه بارگذاری کنید
- تمام فریمهای متن را بازیابی کنید تا هر محفظه متن را از تمام slides جمعآوری کنید.
- از تمام پاراگرافها و بخشهای فریمها عبور کنید و متن را به شیء StringBuilder اضافه کنید
- فایل خروجی را بهصورت فایل TXT ذخیره کنید
مراحل ذکر شده در بالا، فرآیند استخراج متن از PPTX با استفاده از جاوا را خلاصه میکند. ارائه را بارگذاری کنید، به تمام فریمهای متنی دسترسی پیدا کنید، یک شیء StringBuilder ایجاد کنید و از طریق تمام فریمها برای دریافت پاراگرافها تکرار کنید. از هر پاراگراف، بخشها را دریافت کنید، متن هر بخش را استخراج کنید و به نمونه StringBuilder اضافه کنید، و در نهایت متن جمعآوریشده را در یک فایل TXT ذخیره کنید.
کد برای تبدیل PPTX به TXT با استفاده از جاوا
این کد نشان میدهد که چگونه میتوان PowerPoint را با استفاده از Java به متن تبدیل کرد . میتوانید متن را اسلاید به اسلاید با استفاده از متد SlideUtil.getAllTextBoxes() که یک اسلاید را به عنوان ورودی میگیرد استخراج کنید، و یادداشتهای سخنران را با استفاده از متد slide.getNotesSlideManager().getNotesSlide() استخراج کنید، و متن را از جداول با استفاده از slide.getShapes() که مجموعه اشکال را برمیگرداند و هر شکلی که نمونهای از ITable است فیلتر کنید. خروجی JSON نیز میتواند با پر کردن JsonObject و ذخیره دادهها در یک JSONArray تولید شود.
این مقاله فرآیند تبدیل PowerPoint به متن را توضیح میدهد. برای تبدیل یک ارائه به ویدیو، به مقاله تبدیل PowerPoint به ویدیو با استفاده از Java مراجعه کنید.