यह ट्यूटोरियल बताता है कि स्कैन किए गए PDF को Python का उपयोग करके संपादन योग्य PDF में कैसे बदलें। इसमें IDE सेट करने के विवरण, चरणों की सूची, और एक नमूना कोड है जो Python का उपयोग करके PDF को पढ़ने योग्य बनाता है। आप API द्वारा उपलब्ध कराए गए विभिन्न पैरामीटर सेट करके पहचान की अनुकूलन प्रक्रिया सीखेंगे।
Python का उपयोग करके PDF को सर्चेबल PDF में बदलने के चरण
- IDE को Aspose.OCR for Python via Java का उपयोग करने के लिए सेट करें ताकि PDF को स्कैन किया जा सके
- लाइब्रेरी को इम्पोर्ट करें और लाइसेंस को इनिशियलाइज़ करें
- AsposeOcr क्लास ऑब्जेक्ट का उपयोग करके एक पहचान इंजन बनाएं
- स्कैन किए गए PDF का उपयोग करके इनपुट को कॉन्फ़िगर करने के लिए OcrInput ऑब्जेक्ट को इंस्टैंशिएट करें।
- स्कैनिंग प्रक्रिया को नियंत्रित करने के लिए पैरामीटर सेट करके RecognitionSettings ऑब्जेक्ट को परिभाषित करें
- engine.recognize() मेथड को इनपुट ऑब्जेक्ट और रिकग्निशन सेटिंग्स पास करके कॉल करें
- परिणामों को अधिकतम गुणवत्ता के साथ PDF के रूप में सहेजें
ये चरण बताते हैं कि Python का उपयोग करके PDF छवि को PDF टेक्स्ट में कैसे बदलें। AsposeOcr क्लास का उपयोग करके पहचान इंजन को इंस्टैंसिएट करें, OcrInput ऑब्जेक्ट का उपयोग करके इनपुट परिभाषित करें, और वांछित पैरामीटर सेट करने के लिए RecognitionSettings ऑब्जेक्ट को इंस्टैंसिएट करें। अंत में, recognize() मेथड को कॉल करके PDF फ़ाइल को स्कैन करें और save_pdf() मेथड का उपयोग करके पहचान प्रक्रिया के परिणाम को PDF फ़ाइल के रूप में सहेजें।
Python का उपयोग करके PDF चित्र को टेक्स्ट में बदलने का कोड
कृपया वह वाक्य प्रदान करें जिसे आप हिंदी में अनुवादित करना चाहते हैं।
यह नमूना कोड दर्शाता है कि कैसे convert scanned PDF to searchable PDF using Python। save_pdf() मेथड PDF पृष्ठभूमि को जैसा है वैसा ही रेंडर करता है और स्कैन किया गया टेक्स्ट उस पर रखता है। डेवलपर्स पैरामीटर सेट कर सकते हैं जैसे डिटेक्शन भाषा, डिटेक्शन एरिया, सटीकता स्तर, और प्रदर्शन।
यह लेख हमें स्कैन किए गए PDF को पढ़ने योग्य PDF में बदलने की प्रक्रिया सिखाता है। चालानों से डेटा निकालने के लिए, लेख Python का उपयोग करके चालानों से डेटा निष्कर्षण देखें।