如何在 Python 中从 PDF 中获取图像

本主题详细介绍了如何借助配置步骤和可运行的示例代码在 Python 中从 PDF 中获取图像。共享完整的程序代码,可用于开发此应用程序,因为提供了从 Python 中的 PDF 中以不同格式(如 PNG、JPEG 等)获取图像所需的所有类和方法。在从 PDF 文件访问生成的图像后,您还将观察到不同的选项以通过自定义生成的图像来增强流程。

在 Python 中获取 PDF 图像的步骤

  1. 配置 IDE 以使用 Aspose.PDF for Python 通过 .NET 从 PDF 中提取图像
  2. 使用 Document 类对象访问其中包含图像的源 PDF 文件
  3. 使用 XImage 类对象访问页面资源中的特定图像
  4. 使用所需图像的名称生成新的文件流
  5. 将图像保存为磁盘上的 JPEG 文件

这些步骤需要如何在 Python 中从 PDF 中获取图像,方法是公开一个分步方法,首先我们打开源 PDF 文件,然后访问 PDF 中的特定页面。对于每个 PDF 页面,都有一个资源集合,包括可以在索引帮助下引用的图像。一旦使用 XImage 类对象的实例访问所需的图像引用,就可以使用内存流的实例将其保存为磁盘上的图像。

在 Python 中从 PDF 获取图像的代码

此代码展示了在 Python 中从 PDF 中获取图像的过程,方法是将图像访问到 Document 类对象中,然后通过访问其资源列表加载访问特定页面上所需的图像一旦我们可以访问所需的图像,我们可以重命名它,也可以更改文档中的引用。您还可以访问不同的属性,如名称、宽度和高度,以在将图像保存为磁盘上的文件之前过滤图像。

这个例子指导我们从 PDF 页面中提取图像。如果您有兴趣了解在 PDF 文件中添加水印的过程,请参阅 如何在 Python 中为 PDF 添加水印 上的文章。

 简体中文