本教程旨在提供有关如何从 Java 中的 PDF 获取图像的基本信息。您将获得示例代码中使用的资源的参考、指导应用程序开发的详细编程逻辑以及一个可运行的示例代码,用于从 Java 中的 PDF 获取图像,然后将其保存为 JPG 图片。还将提供详细信息以自定义过程,例如从不同来源加载源文档以及为受保护的 PDF 文件设置密码或设置输出图像属性的选项。
在 Java 中从 PDF 获取图像的步骤
- 配置 IDE 以添加 Aspose.PDF for Java 以提取 PDF 图像
- 将输入 PDF 文件从磁盘或内存流加载到 Document class 对象中
- 获取要从中提取图像的目标 PDF 页面的资源集合的引用
- 使用资源中图像集合中的 XImage 类对象获取所需图像的引用
- 实例化 FileOutputStream 对象以保存输出图像
- 将目标图像保存为 JPG 文件
这些步骤提供了从 Java 中的 PDF 中获取图像的分步逻辑。它解释了 PDF 的内部结构,其中每个页面都有一组资源,包括该页面上用于访问目标图像的图像。获取图像引用后,将其保存到 XImage 类对象中,该对象包含将加载的图像保存在磁盘上的方法。
用Java从PDF中获取图像的代码
此代码通过引入用于加载源 PDF 的 Document 类演示如何在 Java 中从 PDF 获取图像。下一个重要的类是 XImage,它可以保存对所选 PDF 页面的图像集合中图像的引用。一旦获得图像参考,您不仅可以使用它将加载的图像保存在磁盘上,还可以从源 PDF 中删除该图像,重命名源 PDF 中的图像,并检查图像是否透明。
本教程还可用于从 Java 中的 PDF 中获取所有图像。如果您对将图像转换为 PDF 的过程感兴趣,请参阅 如何在Java中将图像转换为PDF 上的文章。