使用 Python 从图像中提取文本

本教程将教您如何使用 Python 从图像中提取文本。它提供了设置使用 Aspose.OCR 的环境的信息、描述程序流程的步骤列表以及从图像中提取文本的 Python 代码。您将学习如何从单个 PNG/JPEG/PDF/TIFF/GIF/BMP 图像或目录中的图像集合中提取文本。

使用 Python 从图像中提取文本的步骤

  1. 设置使用 Aspose.OCR for Python via .NET 从图像中提取文本的环境
  2. 创建 AsposeOcr 类的对象,用于读取文本
  3. 创建 OcrInput 集合类的对象,用于添加图像
  4. 将 Ocr 输入类型设置为 DIRECTORY
  5. 向图像集合添加一个或多个目录路径
  6. 通过提供 OcrInput 对象调用 extractTextFromImage() 方法
  7. 在控制台上显示所有提取的文本

这些步骤描述了从图像中提取文本的Python程序。创建AsposeOcr类的对象,OcrInput对象维护图像集合,设置集合中的图像列表,并调用recognize()方法读取文本。最后,通过解析recognize()方法返回的集合逐一显示识别出的文本。

使用 Python 中的 OCR 从图像中提取文本的代码

import aspose.ocr as api
from aspose.ocr import License
# Instantiate a license
license = License()
license.set_license("License.lic")
extractTextFromImage = api.AsposeOcr()
imageDatas = api.OcrInput(api.InputType.DIRECTORY)
imageDatas.add("/Users/myuser/Images/")
textExtractedFromImage = extractTextFromImage.recognize(imageDatas)
length = textExtractedFromImage.length
for i in range(length):
print(textExtractedFromImage[i].recognition_text)

此代码演示了使用 Python 从图像中提取文本。您可以根据需要将输入类型设置为 SINGLE_IMAGE、PDF、TIFF、URL、ZIP 等。您可以使用 OcrInput 类中的 add() 方法添加多个目录路径或图像路径。

本文教我们如何使用 Python 从图像中提取数据。若要读取手写图像,请参阅 使用 Python 将手写内容转换为文本 上的文章。

 简体中文