هذا الدرس يصف كيفية تحويل PDF الممسوحة ضوئياً إلى PDF قابل للتحرير باستخدام Python. يحتوي على تفاصيل لضبط بيئة التطوير المتكاملة، قائمة بالخطوات، وعينة كود لجعل PDF قابل للقراءة باستخدام Python. ستتعلم تخصيص عملية التعرف عن طريق ضبط معلمات مختلفة ي exposeها الـ API.
خطوات تحويل PDF إلى PDF قابل للبحث باستخدام Python
- اضبط الـ IDE لاستخدام Aspose.OCR for Python via Java لمسح ملف PDF
- استيراد المكتبة وتفعيل الترخيص
- إنشاء محرك التعرف باستخدام كائن الفئة AsposeOcr
- إنشاء كائن OcrInput لتكوين الإدخال باستخدام ملف PDF الممسوح ضوئياً
- تعريف كائن RecognitionSettings عن طريق ضبط المعلمات للتحكم في عملية المسح
- استدعِ طريقة engine.recognize() بتمرير كائن الإدخال وإعدادات التعرف
- احفظ النتائج كملف PDF بأعلى جودة
تصف هذه الخطوات كيفية تحويل صورة PDF إلى نص PDF باستخدام بايثون. قم بإنشاء محرك التعرف باستخدام الفئة AsposeOcr، حدد الإدخال باستخدام كائن OcrInput، وأنشئ كائن RecognitionSettings لتعيين المعلمات المطلوبة. أخيرًا، استدعِ الدالة recognize() لمسح ملف PDF وحفظ نتيجة عملية التعرف كملف PDF باستخدام الدالة save_pdf().
كود لتحويل صورة PDF إلى نص باستخدام بايثون
الرجاء تزويدي بالجملة التي تريد ترجمتها.
يعرض هذا المثال البرمجي كيفية تحويل PDF الممسوح ضوئياً إلى PDF قابل للبحث باستخدام Python. تقوم طريقة save_pdf() بعرض خلفية PDF كما هي وتضع النص الممسوح فوقها. يمكن للمطورين ضبط المعلمات مثل لغة الكشف، مناطق الكشف، مستوى الدقة، والأداء.
لقد علمنا هذا المقال العملية لتحويل ملف PDF ممسوح ضوئياً إلى ملف PDF قابل للقراءة. لاستخراج البيانات من الفواتير، راجع المقال Data Extraction from Invoices using Python.