В этом руководстве вы узнаете, как извлечь текст из изображения с помощью Python. В нем содержится информация о настройке среды для использования Aspose.OCR, список шагов для описания потока программы и код Python для извлечения текста из изображения. Вы научитесь извлекать текст из одного изображения PNG/JPEG/PDF/TIFF/GIF/BMP или коллекции изображений в каталоге.
Шаги по извлечению текста из изображения в Python
- Установите среду для использования Aspose.OCR for Python via .NET для извлечения текста из изображения
- Создать объект класса AsposeOcr для чтения текста
- Создать объект класса коллекции OcrInput для добавления изображений
- Установите тип ввода Ocr на DIRECTORY
- Добавьте один или несколько путей к каталогам в коллекцию изображений.
- Вызовите метод extractTextFromImage(), предоставив объект OcrInput
- Отобразить весь извлеченный текст на консоли
Эти шаги описывают программу Python для извлечения текста из изображения. Создайте объект класса AsposeOcr, объект OcrInput для поддержки коллекции изображений, задайте список изображений в коллекции и вызовите метод recognize() для чтения текста. Наконец, распознанный текст отображается один за другим путем разбора возвращенной коллекции из метода recognize().
Код для извлечения текста из изображения с помощью OCR на Python
Этот код демонстрирует извлечение текста из изображения с помощью Python. Вы можете задать тип входных данных SINGLE_IMAGE, PDF, TIFF, URL, ZIP и т. д. в зависимости от ваших требований. Вы можете добавить несколько путей к каталогам или путей к изображениям, используя метод add() в классе OcrInput.
Эта статья научила нас процессу извлечения данных из изображения с помощью Python. Чтобы прочитать рукописное изображение, обратитесь к статье на Преобразование рукописного текста в печатный с помощью Python.