Bu öğretici, Python kullanarak taranmış PDF‘ı düzenlenebilir PDF’ye dönüştürmeyi açıklar. IDE’yi ayarlama, adım listesi ve Python kullanarak PDF’yi okunabilir hâle getiren örnek kodu içerir. API tarafından sunulan çeşitli parametreleri ayarlayarak tanımanın özelleştirilmesini öğreneceksiniz.
Python kullanarak PDF’yi Aranabilir PDF’ye Dönüştürme Adımları
- IDE’yi Aspose.OCR for Python via Java kullanacak şekilde ayarlayın ve bir PDF tarayın.
- Kütüphaneyi içe aktar ve bir lisansı başlat
- AsposeOcr sınıf nesnesini kullanarak bir tanıma motoru oluşturun
- Tarayıcı PDF’sini kullanarak girişi yapılandırmak için OcrInput nesnesini örnekleyin.
- Tarama sürecini kontrol eden parametreleri ayarlayarak RecognitionSettings nesnesini tanımlayın
- engine.recognize() yöntemini, giriş nesnesini ve tanıma ayarlarını geçirerek çağırın.
- Sonuçları maksimum kaliteyle PDF olarak kaydedin
Bu adımlar, Python kullanarak PDF görüntüsünü PDF metnine dönüştürmeyi açıklar. Tanıma motorunu AsposeOcr sınıfını kullanarak örnekleyin, girişi OcrInput nesnesiyle tanımlayın ve istenen parametreleri ayarlamak için RecognitionSettings nesnesini örnekleyin. Son olarak, PDF dosyasını taramak için recognize() metodunu çağırın ve tanıma sürecinin sonucunu save_pdf() metodunu kullanarak bir PDF dosyası olarak kaydedin.
Python kullanarak PDF Resmini Metne Dönüştürme Kodu
Gist içeriği alınamadı; lütfen çevirmemi istediğiniz cümleyi doğrudan sağlayın.
Bu örnek kod, Python kullanarak taranmış PDF’yi aranabilir PDF’ye dönüştürmeyi gösterir. save_pdf() yöntemi PDF arka planını olduğu gibi render eder ve taranmış metni üzerine yerleştirir. Geliştiriciler, algılama dili, algılama alanları, doğruluk seviyesi ve performans gibi parametreleri ayarlayabilir.
Bu makale, taranmış bir PDF’yi okunabilir bir PDF’ye dönüştürme sürecini bize öğretti. Faturalardan veri çıkarmak için, Python Kullanarak Faturalardan Veri Çıkarma makalesine bakın.