Aspose 知识库

使用 Python 从图像中提取文本

本教程将教您如何使用 Python 从图像中提取文本。它提供了设置使用 Aspose.OCR 的环境的信息、描述程序流程的步骤列表以及从图像中提取文本的 Python 代码。您将学习如何从单个 PNG/JPEG/PDF/TIFF/GIF/BMP 图像或目录中的图像集合中提取文本。

使用 Python 从图像中提取文本的步骤

设置使用 Aspose.OCR for Python via .NET 从图像中提取文本的环境
创建 AsposeOcr 类的对象，用于读取文本
创建 OcrInput 集合类的对象，用于添加图像
将 Ocr 输入类型设置为 DIRECTORY
向图像集合添加一个或多个目录路径
通过提供 OcrInput 对象调用 extractTextFromImage() 方法
在控制台上显示所有提取的文本

这些步骤描述了从图像中提取文本的Python程序。创建AsposeOcr类的对象，OcrInput对象维护图像集合，设置集合中的图像列表，并调用recognize（）方法读取文本。最后，通过解析recognize（）方法返回的集合逐一显示识别出的文本。

使用 Python 中的 OCR 从图像中提取文本的代码

此代码演示了使用 Python 从图像中提取文本。您可以根据需要将输入类型设置为 SINGLE_IMAGE、PDF、TIFF、URL、ZIP 等。您可以使用 OcrInput 类中的 add() 方法添加多个目录路径或图像路径。

本文教我们如何使用 Python 从图像中提取数据。若要读取手写图像，请参阅使用 Python 将手写内容转换为文本上的文章。