Ten samouczek nauczy Cię, jak wyodrębnić tekst z obrazu za pomocą Pythona. Zawiera informacje o tym, jak ustawić środowisko do korzystania z Aspose.OCR, listę kroków opisujących przepływ programu oraz kod Pythona do wyodrębniania tekstu z obrazu. Nauczysz się wyodrębniać tekst z pojedynczego obrazu PNG/JPEG/PDF/TIFF/GIF/BMP lub zbioru obrazów w katalogu.
Kroki wyodrębniania tekstu z obrazu w Pythonie
- Ustaw środowisko do użycia Aspose.OCR for Python via .NET w celu wyodrębnienia tekstu z obrazu
- Utwórz obiekt klasy AsposeOcr do odczytu tekstu
- Utwórz obiekt klasy kolekcji OcrInput w celu dodawania obrazów
- Ustaw typ wejścia OCR na KATALOG
- Dodaj jedną lub więcej ścieżek katalogów do kolekcji obrazów
- Wywołaj metodę extractTextFromImage(), podając obiekt OcrInput
- Wyświetl cały wyodrębniony tekst na konsoli
Te kroki opisują program Python do wyodrębniania tekstu z obrazu. Utwórz obiekt klasy AsposeOcr, obiekt OcrInput, aby utrzymać kolekcję obrazów, ustaw listę obrazów w kolekcji i wywołaj metodę recognize(), aby odczytać tekst. Na koniec rozpoznany tekst jest wyświetlany jeden po drugim poprzez parsowanie zwróconej kolekcji z metody recognize().
Kod do wyodrębniania tekstu z obrazu za pomocą OCR w Pythonie
Ten kod demonstruje ekstrakcję tekstu z obrazu za pomocą Pythona. Możesz ustawić typ wejściowy na SINGLE_IMAGE, PDF, TIFF, URL, ZIP itp. w zależności od swoich wymagań. Możesz dodać wiele ścieżek katalogów lub ścieżek obrazu, używając metody add() w klasie OcrInput.
Ten artykuł nauczył nas procesu ekstrakcji danych z obrazu za pomocą Pythona. Aby przeczytać ręcznie napisany obraz, zapoznaj się z artykułem na Konwersja pisma odręcznego na tekst za pomocą Pythona.