Wyodrębnij tekst z obrazu za pomocą Pythona

Ten samouczek nauczy Cię, jak wyodrębnić tekst z obrazu za pomocą Pythona. Zawiera informacje o tym, jak ustawić środowisko do korzystania z Aspose.OCR, listę kroków opisujących przepływ programu oraz kod Pythona do wyodrębniania tekstu z obrazu. Nauczysz się wyodrębniać tekst z pojedynczego obrazu PNG/JPEG/PDF/TIFF/GIF/BMP lub zbioru obrazów w katalogu.

Kroki wyodrębniania tekstu z obrazu w Pythonie

  1. Ustaw środowisko do użycia Aspose.OCR for Python via .NET w celu wyodrębnienia tekstu z obrazu
  2. Utwórz obiekt klasy AsposeOcr do odczytu tekstu
  3. Utwórz obiekt klasy kolekcji OcrInput w celu dodawania obrazów
  4. Ustaw typ wejścia OCR na KATALOG
  5. Dodaj jedną lub więcej ścieżek katalogów do kolekcji obrazów
  6. Wywołaj metodę extractTextFromImage(), podając obiekt OcrInput
  7. Wyświetl cały wyodrębniony tekst na konsoli

Te kroki opisują program Python do wyodrębniania tekstu z obrazu. Utwórz obiekt klasy AsposeOcr, obiekt OcrInput, aby utrzymać kolekcję obrazów, ustaw listę obrazów w kolekcji i wywołaj metodę recognize(), aby odczytać tekst. Na koniec rozpoznany tekst jest wyświetlany jeden po drugim poprzez parsowanie zwróconej kolekcji z metody recognize().

Kod do wyodrębniania tekstu z obrazu za pomocą OCR w Pythonie

Ten kod demonstruje ekstrakcję tekstu z obrazu za pomocą Pythona. Możesz ustawić typ wejściowy na SINGLE_IMAGE, PDF, TIFF, URL, ZIP itp. w zależności od swoich wymagań. Możesz dodać wiele ścieżek katalogów lub ścieżek obrazu, używając metody add() w klasie OcrInput.

Ten artykuł nauczył nas procesu ekstrakcji danych z obrazu za pomocą Pythona. Aby przeczytać ręcznie napisany obraz, zapoznaj się z artykułem na Konwersja pisma odręcznego na tekst za pomocą Pythona.

 Polski