Този урок описва как да конвертирате сканиран PDF в редактиран PDF с помощта на Python. Той съдържа подробности за настройване на IDE, списък със стъпки и примерен код за правене на PDF четим с Python. Ще научите персонализирането на разпознаването, като зададете различни параметри, изложени от API-то.
Стъпки за конвертиране на PDF в търсим PDF с Python
- Настройте IDE да използва Aspose.OCR for Python via Java за сканиране на PDF
- Импортирайте библиотеката и инициализирайте лиценз
- Създайте разпознаващ механизъм, използвайки обекта на класа AsposeOcr
- Създайте обекта OcrInput, за да конфигурирате входа, използвайки сканирания PDF
- Дефинирайте обекта RecognitionSettings, като зададете параметрите за контролиране на процеса на сканиране
- Извикайте метода engine.recognize() като предадете входния обект и настройките за разпознаване
- Запазете резултатите като PDF с максимално качество
Тези стъпки описват как да преобразувате PDF изображение в PDF текст с помощта на Python. Създайте разпознаващия двигател, използвайки класа AsposeOcr, определете входа, използвайки обекта OcrInput, и създайте обекта RecognitionSettings за задаване на желаните параметри. Накрая извикайте метода recognize() за сканиране на PDF файла и запазете резултата от процеса на разпознаване като PDF файл, използвайки метода save_pdf().
Код за конвертиране на PDF изображение в текст с Python
Не мога да достъпя съдържанието на посочения gist, за да извърша превода. Моля, предоставете изречението директно.
Този примерен код демонстрира как да конвертирате сканиран PDF в търсим PDF, използвайки Python. Методът save_pdf() рендерира фона на PDF така както е и поставя сканирания текст върху него. Разработчиците могат да зададат параметри като език за откриване, области за откриване, ниво на точност и производителност.
Тази статия ни научи на процеса за превръщане на сканиран PDF в четим PDF. За извличане на данни от фактури, вижте статията Data Extraction from Invoices using Python.