Šioje trumpoje pamokoje paaiškinama, kaip skaityti PDF metaduomenis naudojant Python. Jame yra išsami informacija, skirta programos kūrimo aplinkai nustatyti, laipsniška procedūra ir vykdomas pavyzdinis kodas, skirtas metaduomenų ištraukimui iš PDF naudojant Python. Sužinosite, kaip lengva parašyti programą ir pasiekti metaduomenų informaciją iš PDF, naudojant labai nedaug API iškvietimų, neįdiegę jokio trečiosios šalies įrankio jokioje iš Python palaikomos aplinkos.
Veiksmai, kaip skaityti PDF metaduomenis naudojant Python
- Sukurkite aplinką naudokite Aspose.PDF, skirtą Python per .NET, kad galėtumėte skaityti metaduomenis
- Įkelkite šaltinio PDF failą naudodami Document klasės objektą, kad gautumėte metaduomenis
- Gaukite prieigą prie DocumentInfo klasės objekto, kuriame yra PDF metaduomenys
- Pasiekite kelias informacijos ypatybes ir parodykite jas konsolėje
Šiuose žingsniuose aprašomas PDF metaduomenų peržiūros naudojant Python procesas. Pirmiausia turite įkelti tikslinį PDF failą, o tada pasiekti DocumentInfo ypatybę pavadinimu Info dokumentų klasėje. Šiame objekte yra visi PDF failo metaduomenys, pvz., kūrėjas, modifikavimo laiko juosta, gamintojas, sukūrimo data ir pakeitimo data.
Kodas PDF metaduomenų gavimui naudojant Python
Šis kodas tiesiog parodo PDF metaduomenų gavimo naudojant Python procedūrą. DocumentInfo klasės objektas pasiekiamas iš įkelto dokumento, kuriame yra daug metaduomenų informacijos, pvz., įstrigusi vėliavėlė, pavadinimas, tema, dokumento raktiniai žodžiai ir autorius. Jei norite pridėti šias ypatybes, galite naudoti DocumentInfo.add() metodą, naudokite clear() metodą metaduomenims išvalyti, o pašalinti () metodą tik nurodytus metaduomenis.
Šiame straipsnyje aprašytas metaduomenų iš PDF gavimo procesas. Jei norite sužinoti, kaip skaityti PDF turinį, žr. straipsnį kaip skaityti PDF turinį Python.