本教程将教您如何使用 Python 从图像中提取文本。它提供了设置使用 Aspose.OCR 的环境的信息、描述程序流程的步骤列表以及从图像中提取文本的 Python 代码。您将学习如何从单个 PNG/JPEG/PDF/TIFF/GIF/BMP 图像或目录中的图像集合中提取文本。
使用 Python 从图像中提取文本的步骤
- 设置使用 Aspose.OCR for Python via .NET 从图像中提取文本的环境
- 创建 AsposeOcr 类的对象,用于读取文本
- 创建 OcrInput 集合类的对象,用于添加图像
- 将 Ocr 输入类型设置为 DIRECTORY
- 向图像集合添加一个或多个目录路径
- 通过提供 OcrInput 对象调用 extractTextFromImage() 方法
- 在控制台上显示所有提取的文本
这些步骤描述了从图像中提取文本的Python程序。创建AsposeOcr类的对象,OcrInput对象维护图像集合,设置集合中的图像列表,并调用recognize()方法读取文本。最后,通过解析recognize()方法返回的集合逐一显示识别出的文本。
使用 Python 中的 OCR 从图像中提取文本的代码
import aspose.ocr as api | |
from aspose.ocr import License | |
# Instantiate a license | |
license = License() | |
license.set_license("License.lic") | |
extractTextFromImage = api.AsposeOcr() | |
imageDatas = api.OcrInput(api.InputType.DIRECTORY) | |
imageDatas.add("/Users/myuser/Images/") | |
textExtractedFromImage = extractTextFromImage.recognize(imageDatas) | |
length = textExtractedFromImage.length | |
for i in range(length): | |
print(textExtractedFromImage[i].recognition_text) |
此代码演示了使用 Python 从图像中提取文本。您可以根据需要将输入类型设置为 SINGLE_IMAGE、PDF、TIFF、URL、ZIP 等。您可以使用 OcrInput 类中的 add() 方法添加多个目录路径或图像路径。
本文教我们如何使用 Python 从图像中提取数据。若要读取手写图像,请参阅 使用 Python 将手写内容转换为文本 上的文章。