Bài viết này hướng dẫn cách so sánh PDF tài liệu bằng C#. Bài viết có thông tin chi tiết để thiết lập IDE cho quá trình phát triển, danh sách các bước lập trình và mã mẫu để phát triển công cụ so sánh PDF bằng C#. Bạn sẽ học cách so sánh từng trang hoặc so sánh toàn bộ hai tệp PDF mà không cần sử dụng bất kỳ công cụ của bên thứ ba nào.
Các bước để so sánh các tệp PDF bằng C#
- Đặt môi trường để sử dụng Aspose.PDF for .NET để so sánh các tệp PDF
- Tải cả hai tệp PDF vào các đối tượng riêng biệt của lớp Document
- Khởi tạo đối tượng ComparisonOptions cho các thiết lập tùy chỉnh
- Sử dụng không gian tên TextPdfComparer và gọi phương thức ComparePages() để so sánh các trang riêng lẻ
- Sử dụng CompareFlatDocuments() để so sánh hai tệp khác nhau
Các bước trên mô tả quy trình so sánh hai tài liệu PDF bằng C#. Tải cả hai tệp PDF riêng biệt vào đối tượng lớp Document và truy cập tham chiếu đến các trang đích từ cả hai tệp. Gọi phương thức TextPdfComparer.ComparePages() để so sánh các trang hoặc gọi phương thức TextPdfComparer.CompareFlatDocuments() để so sánh toàn bộ văn bản của hai tệp đã tải.
Mã để so sánh hai tệp PDF bằng C#
Mã trên minh họa cơ chế phát triển công cụ so sánh tài liệu PDF bằng C#. Bạn có thể tùy chỉnh quy trình bằng cách thiết lập danh sách các vùng hình chữ nhật bị loại trừ trong tệp 1 và 2, đánh dấu để loại trừ các bảng khỏi phép so sánh hoặc xác định các vùng trích xuất từ các trang đã chọn. So sánh trang trả về danh sách các điểm khác biệt trong các trang, trong khi so sánh tệp trả về tệp PDF chứa thông tin chi tiết về các điểm khác biệt giữa hai tệp.
Hướng dẫn này đã hướng dẫn chúng ta cách so sánh các tệp PDF. Nếu bạn muốn hợp nhất các tệp PDF, hãy tham khảo bài viết trên cách ghép các tập tin PDF bằng C#.