Извлечение текста из изображения с помощью Python

В этом руководстве вы узнаете, как извлечь текст из изображения с помощью Python. В нем содержится информация о настройке среды для использования Aspose.OCR, список шагов для описания потока программы и код Python для извлечения текста из изображения. Вы научитесь извлекать текст из одного изображения PNG/JPEG/PDF/TIFF/GIF/BMP или коллекции изображений в каталоге.

Шаги по извлечению текста из изображения в Python

  1. Установите среду для использования Aspose.OCR for Python via .NET для извлечения текста из изображения
  2. Создать объект класса AsposeOcr для чтения текста
  3. Создать объект класса коллекции OcrInput для добавления изображений
  4. Установите тип ввода Ocr на DIRECTORY
  5. Добавьте один или несколько путей к каталогам в коллекцию изображений.
  6. Вызовите метод extractTextFromImage(), предоставив объект OcrInput
  7. Отобразить весь извлеченный текст на консоли

Эти шаги описывают программу Python для извлечения текста из изображения. Создайте объект класса AsposeOcr, объект OcrInput для поддержки коллекции изображений, задайте список изображений в коллекции и вызовите метод recognize() для чтения текста. Наконец, распознанный текст отображается один за другим путем разбора возвращенной коллекции из метода recognize().

Код для извлечения текста из изображения с помощью OCR на Python

Этот код демонстрирует извлечение текста из изображения с помощью Python. Вы можете задать тип входных данных SINGLE_IMAGE, PDF, TIFF, URL, ZIP и т. д. в зависимости от ваших требований. Вы можете добавить несколько путей к каталогам или путей к изображениям, используя метод add() в классе OcrInput.

Эта статья научила нас процессу извлечения данных из изображения с помощью Python. Чтобы прочитать рукописное изображение, обратитесь к статье на Преобразование рукописного текста в печатный с помощью Python.

 Русский