यह संक्षिप्त गाइड बताता है कि Python का उपयोग करके PowerPoint से टेक्स्ट कैसे निकाला जाए। इसमें IDE सेट करने के विवरण, चरणों की सूची, और Python का उपयोग करके PowerPoint को टेक्स्ट में बदलने के लिए एक नमूना कोड शामिल है। स्लाइड्स से टेक्स्ट प्राप्त करने के विभिन्न तकनीकों पर चर्चा की जाएगी।
Python का उपयोग करके PPTX से टेक्स्ट निकालने के चरण
- IDE को Aspose.Slides for Python via .NET का उपयोग करने के लिए सेट करें ताकि टेक्स्ट निकाला जा सके
- लाइब्रेरी से वांछित क्लासेस और SlideUtil यूटिलिटी क्लास को इम्पोर्ट करें
- इनपुट/आउटपुट फ़ाइल पथ निर्धारित करें और लाइसेंस लोड करें
- स्रोत PowerPoint प्रस्तुति को Presentation ऑब्जेक्ट में लोड करें
- हर स्लाइड से सभी टेक्स्ट फ्रेम निकालने के लिए SlideUtil.get_all_text_frames का उपयोग करें
- सभी टेक्स्ट फ्रेम और उनके पैराग्राफ़ को पार्स करके व्यक्तिगत टेक्स्ट भाग एकत्र करें
- प्रत्येक फ्रेम को प्रोसेस करें और नई पंक्ति में स्लाइड की सामग्री जोड़ें
- सभी एकत्रित पाठ भागों को सहेजें और आउटपुट को एक TXT फ़ाइल में सहेजें
ये चरण PPTX to text converter using Python विकसित करने की प्रक्रिया को समझाते हैं। प्रस्तुति लोड करें, उससे सभी टेक्स्ट फ्रेम प्राप्त करें, सभी फ्रेम में प्रत्येक पैराग्राफ को पार्स करें, और उनमें से भागों से टेक्स्ट निकालें। सभी एकत्रित डेटा को एक टेक्स्ट फ़ाइल में प्रत्येक टेक्स्ट सेगमेंट के लिए लाइन सेपरेटर के साथ सहेजें।
Python का उपयोग करके PowerPoint को टेक्स्ट में बदलने के लिए कोड
यह कोड दिखाता है कि convert PPTX to TXT using Python कैसे किया जाए। पूरे प्रेजेंटेशन को एक बार स्कैन करने के बजाय, आप प्रत्येक स्लाइड को अलग‑अलग एक्सेस कर सकते हैं और केवल चयनित स्लाइड्स से टेक्स्ट प्राप्त करने के लिए उसे प्रोसेस कर सकते हैं। एक और विकल्प यह है कि आप प्रेजेंटेशन को मेमोरी में लोड नहीं करते और केवल फ़ाइल पाथ का उपयोग करके उसके टेक्स्ट को निकालते हैं, जिसमें एक फ़्लैग के साथ टेक्स्ट को व्यवस्थित क्रम में, मूल रूप में या फ्लैट क्रम में प्राप्त किया जा सकता है।
यह छोटा लेख PPTX से टेक्स्ट निकालने पर मार्गदर्शन करता है। प्रस्तुति को वीडियो में बदलने के लिए, लेख Python का उपयोग करके PowerPoint को वीडियो में बदलें देखें।