Tutorial ini menjelaskan cara mengonversi PDF yang dipindai menjadi PDF yang dapat diedit menggunakan Python. Ini berisi detail untuk mengatur IDE, daftar langkah, dan contoh kode untuk membuat PDF dapat dibaca menggunakan Python. Anda akan mempelajari kustomisasi pengenalan dengan mengatur berbagai parameter yang disediakan oleh API.
Langkah-langkah Mengonversi PDF menjadi PDF yang Dapat Dicari dengan Python
- Atur IDE untuk menggunakan Aspose.OCR for Python via Java untuk memindai PDF
- Impor perpustakaan dan inisialisasi lisensi
- Buat mesin pengenalan menggunakan objek kelas AsposeOcr
- Instansiasi objek OcrInput untuk mengonfigurasi input menggunakan PDF yang dipindai
- Definisikan objek RecognitionSettings dengan mengatur parameter untuk mengendalikan proses pemindaian
- Panggil metode
engine.recognize()dengan memberikan objek input dan pengaturan pengenalan - Simpan hasil sebagai PDF dengan kualitas maksimum
Langkah‑langkah ini menjelaskan cara mengubah gambar PDF menjadi teks PDF menggunakan Python. Buat instance mesin pengenalan menggunakan kelas AsposeOcr, tentukan input menggunakan objek OcrInput, dan buat instance objek RecognitionSettings untuk mengatur parameter yang diinginkan. Akhirnya, panggil metode recognize() untuk memindai file PDF dan simpan hasil proses pengenalan sebagai file PDF menggunakan metode save_pdf().
Kode untuk Mengonversi Gambar PDF menjadi Teks menggunakan Python
Silakan berikan kalimat yang ingin diterjemahkan.
Contoh kode ini menunjukkan cara mengonversi PDF yang dipindai menjadi PDF yang dapat dicari menggunakan Python. Metode save_pdf() merender latar belakang PDF apa adanya dan menempatkan teks yang dipindai di atasnya. Pengembang dapat mengatur parameter seperti bahasa deteksi, area deteksi, tingkat akurasi, dan kinerja.
Artikel ini telah mengajarkan kami proses mengubah PDF yang dipindai menjadi PDF yang dapat dibaca. Untuk mengekstrak data dari faktur, lihat artikel Ekstraksi Data dari Faktur menggunakan Python.