این آموزش توضیح میدهد که چگونه اسکن PDF را به PDF قابل ویرایش با استفاده از پایتون تبدیل کنید. جزئیاتی برای تنظیم IDE، فهرستی از مراحل، و یک کد نمونه برای قابل خواندن کردن PDF با پایتون دارد. شما با تنظیم پارامترهای مختلف ارائهشده توسط API، سفارشیسازی تشخیص را یاد خواهید گرفت.
مراحل تبدیل PDF به PDF قابل جستجو با استفاده از Python
- IDE را طوری تنظیم کنید که از Aspose.OCR for Python via Java برای اسکن PDF استفاده کند
- کتابخانه را وارد کنید و لایسنس را مقداردهی کنید
- یک موتور شناسایی با استفاده از شیء کلاس AsposeOcr ایجاد کنید
- شی OcrInput را برای پیکربندی ورودی با استفاده از PDF اسکنشده نمونهسازی کنید
- شیء RecognitionSettings را با تنظیم پارامترها برای کنترل فرآیند اسکن تعریف کنید
- متد
engine.recognize()را با عبور شیء ورودی و تنظیمات تشخیص فراخوانی کنید - نتایج را با حداکثر کیفیت به صورت PDF ذخیره کنید
این مراحل نحوه تبدیل یک PDF image to PDF text using Python را توصیف میکنند. موتور شناسایی را با استفاده از کلاس AsposeOcr ایجاد کنید، ورودی را با استفاده از شی OcrInput تعریف کنید، و شی RecognitionSettings را برای تنظیم پارامترهای مورد نظر ایجاد کنید. در نهایت، متد recognize() را فراخوانی کنید تا فایل PDF را اسکن کرده و نتیجهٔ فرآیند شناسایی را به عنوان یک فایل PDF با استفاده از متد save_pdf() ذخیره کنید.
کد برای تبدیل تصویر PDF به متن با استفاده از پایتون
لطفاً جملهای که میخواهید ترجمه شود را اینجا بنویسید تا بتوانم آن را به فارسی ترجمه کنم.
این کد نمونه نشان میدهد که چگونه میتوان PDF اسکنشده را به PDF قابل جستجو با استفاده از پایتون تبدیل کرد. متد save_pdf() پسزمینه PDF را همانگونه رندر میکند و متن اسکنشده را روی آن قرار میدهد. توسعهدهندگان میتوانند پارامترهایی مانند زبان تشخیص، نواحی تشخیص، سطح دقت و عملکرد را تنظیم کنند.
این مقاله به ما فرآیند تبدیل یک PDF اسکنشده به PDF قابل خواندن را آموزش داد. برای استخراج دادهها از فاکتورها، به مقاله استخراج دادهها از فاکتورها با پایتون مراجعه کنید.