使用 C# 从 PDF 中提取链接

本文指导如何使用 C# 从 PDF 中提取链接。它包含 IDE 设置、步骤和使用 C# 开发 PDF 链接提取器的示例代码。您将学习如何从页面中检索选定的注释并从链接类型注释中获取 URI。

使用 C# 从 PDF 中提取 URL 的步骤

  1. 设置 IDE 使用 Aspose.PDF for .NET 从 PDF 页面提取 URI
  2. 加载源 PDF file 并循环遍历其中的所有页面
  3. 创建 annotation selector 用于查找页面上的链接注释
  4. 提取所有注释并检索选定注释的列表
  5. 遍历每个链接注释并找到相关的操作
  6. 将操作转换为 GoToURIAction 以访问和显示 URI

这些步骤描述了如何使用 C# 从 PDF 中提取超链接。为链接注释创建一个注释选择器并使用它来选择目标注释列表。将每个链接注释强制转换为 GoToURIAction 并从此操作中获取 URI。

使用 C# 从 PDF 中提取超链接的代码

上面的代码演示了如何使用 C# 从 PDF 中提取所有链接。AnnotationSelector 采用需要页面和矩形对象的 LinkAnnotation 对象。Page 类中的 Accept() 方法采用链接选择器对象并将链接注释保存在 Selected 集合中。

本快速教程教会了我们从 PDF 页面中提取超链接的过程。要从 PDF 文件中删除超链接,请参阅文章 如何在 C# 中删除 PDF 中的超链接

 简体中文