Cara Membaca Metadata PDF menggunakan Python

Tutorial singkat ini menjelaskan cara membaca metadata PDF menggunakan Python. Ini berisi informasi mendetail untuk mengatur lingkungan untuk mengembangkan aplikasi, prosedur bertahap, dan kode contoh yang dapat dijalankan untuk mengekstraksi metadata dari PDF menggunakan Python. Anda akan belajar betapa mudahnya menulis aplikasi dan mengakses informasi metadata dari PDF menggunakan sangat sedikit panggilan API tanpa memasang alat pihak ketiga apa pun di lingkungan yang didukung Python.

Langkah-langkah Membaca Metadata PDF menggunakan Python

  1. Tetapkan lingkungan ke gunakan Aspose.PDF untuk Python melalui .NET untuk membaca metadata
  2. Muat file PDF sumber menggunakan objek kelas Document untuk mengambil metadata
  3. Dapatkan akses ke objek kelas DocumentInfo yang berisi metadata PDF
  4. Akses beberapa properti informasi dan tampilkan di konsol

Langkah-langkah ini menjelaskan proses untuk melihat metadata PDF menggunakan Python. Pertama, Anda perlu memuat file PDF target dan kemudian mengakses properti DocumentInfo bernama ‘Info’ di kelas Dokumen. Objek ini memiliki semua metadata dalam PDF seperti pembuat, zona waktu modifikasi, produser, tanggal pembuatan, dan tanggal modifikasi.

Kode untuk Mendapatkan Metadata PDF menggunakan Python

Kode ini hanya menunjukkan prosedur untuk mengambil metadata PDF menggunakan Python. Objek kelas DocumentInfo diakses dari dokumen yang dimuat yang memiliki sejumlah informasi metadata seperti bendera yang terperangkap, judul, subjek, kata kunci dokumen, dan penulis. Jika Anda ingin menambahkan properti ini, Anda dapat menggunakan metode DocumentInfo.add(), gunakan metode clear() untuk menghapus metadata, dan gunakan metode remove() untuk menghapus metadata yang ditentukan saja.

Artikel ini telah menjelaskan proses untuk mengambil metadata dari PDF. Jika Anda ingin mempelajari proses membaca konten PDF, lihat artikel di cara membaca konten PDF dengan Python.

 Indonesian