Java'da Taranan PDF'den Metin Nasıl Çıkarılır

Bu hızlı eğitim, Java’da taranan PDF’den metin çıkarma hakkında ayrıntılar sağlar. Algılama parametrelerini ayarlayarak bu Java’da taranan PDF’den metin çıkarma işlemini yapılandırabilirsiniz. PDF kalitesine ve diğer uygulama gereksinimlerine bağlı olarak hız veya doğruluk arasında seçim yapma seçeneği de mevcuttur.

Java’da Taranan PDF’den Metin Çıkarma Adımları

  1. Maven deposundan, taranmış PDF metnini okumak için projenizde Aspose.OCR öğesini yapılandırın
  2. PDF’den metin okumak için AsposeOcrPdf nesnesini başlat
  3. Tanıma parametrelerini ayarlamak için DocumentRecognitionSettings sınıf nesnesini örnekleyin
  4. Metni okumak için PDF’deki başlangıç sayfasını ve sayfa sayısını ayarlayın
  5. Algılama hızını artırmak için algılama alanları bayrağını false olarak ayarlayın
  6. Yukarıdaki yapılandırmaya göre tüm metni okumak için RecognizePdf işlevini çağırın
  7. PDF sayfalarından çıkarılan tüm sonuçları yineleyin ve bunları konsolda görüntüleyin

Java’da PDF’den metin tarama işlemi sırasında, aslında PDF’den metin tanıma özelliklerini içeren bir AsposeOCRPdf nesnesi başlatılır. Başlangıç sayfa numarası, okunacak PDF sayfası sayısı ve hız ve doğruluğu kontrol etmek için algılama alanlarını ayarlama seçeneği gibi algılama sürecini yapılandırmayı destekler. Son olarak, her sayfadan taranan sonuç koleksiyonunu ayrıştırır ve bunları konsolda görüntüleriz.

Java’da taranan PDF’yi metne dönüştürmek için kod

Bu kod AsposeOCRPdf’yi kullanarak * Java’da taranan PDF’den metin alır*. DocumentRecognitionSettings sınıf nesnesi, bu örnek kodda gösterildiği gibi yapıcıyı kullanarak veya StartPage ve PagesNumber’ı ayrı ayrı ayarlayarak sayfa yapılandırmasını ayarlama seçeneklerini içerir. Taranan PDF’den metnin paralel olarak algılanması için dili, görüntü eğriliği düzeltmelerini ve iplik sayısını da ayarlayabilirsiniz.

Bu makalede, algılama işleminin yapılandırmasıyla birlikte Java’da taranan PDF’den metin çıkarmayı öğrendik. Ancak, bir görüntüden metin çıkarmak istiyorsanız Java kullanarak görüntüden metin nasıl çıkarılır makalesine bakın.

 Türkçe