如何在 Java 中从 PDF 中获取图像

本教程旨在提供有关如何从 Java 中的 PDF 获取图像的基本信息。您将获得示例代码中使用的资源的参考、指导应用程序开发的详细编程逻辑以及一个可运行的示例代码,用于从 Java 中的 PDF 获取图像,然后将其保存为 JPG 图片。还将提供详细信息以自定义过程,例如从不同来源加载源文档以及为受保护的 PDF 文件设置密码或设置输出图像属性的选项。

在 Java 中从 PDF 获取图像的步骤

  1. 配置 IDE 以添加 Aspose.PDF for Java 以提取 PDF 图像
  2. 将输入 PDF 文件从磁盘或内存流加载到 Document class 对象中
  3. 获取要从中提取图像的目标 PDF 页面的资源集合的引用
  4. 使用资源中图像集合中的 XImage 类对象获取所需图像的引用
  5. 实例化 FileOutputStream 对象以保存输出图像
  6. 将目标图像保存为 JPG 文件

这些步骤提供了从 Java 中的 PDF 中获取图像的分步逻辑。它解释了 PDF 的内部结构,其中每个页面都有一组资源,包括该页面上用于访问目标图像的图像。获取图像引用后,将其保存到 XImage 类对象中,该对象包含将加载的图像保存在磁盘上的方法。

用Java从PDF中获取图像的代码

此代码通过引入用于加载源 PDF 的 Document 类演示如何在 Java 中从 PDF 获取图像。下一个重要的类是 XImage,它可以保存对所选 PDF 页面的图像集合中图像的引用。一旦获得图像参考,您不仅可以使用它将加载的图像保存在磁盘上,还可以从源 PDF 中删除该图像,重命名源 PDF 中的图像,并检查图像是否透明。

本教程还可用于从 Java 中的 PDF 中获取所有图像。如果您对将图像转换为 PDF 的过程感兴趣,请参阅 如何在Java中将图像转换为PDF 上的文章。

 简体中文