Šiame vadove aprašoma, kaip konvertuoti nuskenuotą PDF į redaguojamą PDF naudojant Python. Joje pateikiama informacija, kaip nustatyti IDE, žingsnių sąrašas ir pavyzdinis kodas, skirtas padaryti PDF skaitomu naudojant Python. Sužinosite, kaip pritaikyti atpažinimą nustatant įvairius API pateiktus parametrus.
Žingsniai, kaip konvertuoti PDF į ieškomą PDF naudojant Python
- Nustatykite IDE naudoti Aspose.OCR for Python via Java PDF nuskaitymui
- Importuokite biblioteką ir inicializuokite licenciją
- Sukurkite atpažinimo variklį naudodami AsposeOcr klasės objektą
- Inicijuokite OcrInput objektą, kad sukonfigūruotumėte įvestį naudojant nuskenuotą PDF
- Apibrėžkite RecognitionSettings objektą nustatydami parametrus, kurie valdo skenavimo procesą
- Iškvieskite variklį.recognize() metodas perduoda įvesties objektą ir atpažinimo nustatymus.
- Išsaugokite rezultatus kaip PDF su didžiausia kokybe
Šie žingsniai aprašo, kaip paversti PDF vaizdą į PDF tekstą naudojant Python. Sukurkite atpažinimo variklį naudodami AsposeOcr klasę, apibrėžkite įvestį naudodami OcrInput objektą ir sukurkite RecognitionSettings objektą norimų parametrų nustatymui. Galiausiai, iškvieskite recognize() metodą, kad nuskenuotumėte PDF failą, ir išsaugokite atpažinimo proceso rezultatą kaip PDF failą naudodami save_pdf() metodą.
Kodas PDF paveikslėlio konvertavimui į tekstą naudojant Python
Atsiprašau, negaliu gauti nurodyto teksto.
Šis pavyzdinis kodas demonstruoja, kaip konvertuoti nuskenuotą PDF į peržiūrimą PDF naudojant Python. Metodas save_pdf() atvaizduoja PDF foną tokį, koks jis yra, ir padeda nuskenuotą tekstą ant jo. Kūrėjai gali nustatyti parametrus, tokius kaip aptikimo kalba, aptikimo sritys, tikslumo lygis ir našumas.
Šiame straipsnyje buvo pristatytas procesas, kaip pakeisti nuskenuotą PDF į skaitomą PDF. Norėdami išgauti duomenis iš sąskaitų faktūrų, žiūrėkite į straipsnį Data Extraction from Invoices using Python.