Trích xuất liên kết từ PDF bằng C#

Bài viết này hướng dẫn cách trích xuất liên kết từ PDF bằng C#. Bài viết có các thiết lập IDE, các bước và mã mẫu để phát triển trình trích xuất liên kết PDF bằng C#. Bạn sẽ học cách lấy các chú thích đã chọn từ một trang và lấy URI từ các chú thích kiểu liên kết.

Các bước trích xuất URL từ PDF bằng C#

  1. Đặt IDE để sử dụng Aspose.PDF for .NET để trích xuất URI từ trang PDF
  2. Tải tệp PDF nguồn file và lặp qua tất cả các trang trong đó
  3. Tạo annotation selector để tìm chú thích liên kết trên một trang
  4. Trích xuất tất cả các chú thích và lấy danh sách các chú thích đã chọn
  5. Lặp lại qua từng chú thích liên kết và tìm các hành động liên quan
  6. Chuyển hành động sang GoToURIAction để truy cập và hiển thị URI

Các bước này mô tả cách trích xuất siêu liên kết từ PDF bằng C#. Tạo một bộ chọn chú thích cho các chú thích liên kết và sử dụng nó để chọn danh sách các chú thích mục tiêu. Ép kiểu từng chú thích liên kết thành GoToURIAction và lấy URI từ hành động này.

Mã để trích xuất siêu liên kết từ PDF bằng C#

Mã ở trên minh họa cách trích xuất tất cả các liên kết từ PDF bằng C#. AnnotationSelector lấy một đối tượng LinkAnnotation yêu cầu đối tượng page và hình chữ nhật. Phương thức Accept() trong lớp Page lấy đối tượng chọn liên kết và lưu các chú thích liên kết trong bộ sưu tập Selected.

Hướng dẫn nhanh này đã hướng dẫn chúng ta cách trích xuất siêu liên kết từ trang PDF. Để xóa siêu liên kết khỏi tệp PDF, hãy tham khảo bài viết Cách xóa siêu liên kết khỏi PDF trong C#.

 Tiếng Việt