Det här ämnet tar upp detaljer om hur man får bilder från en PDF i Python med hjälp av konfigurationssteg och en körbar exempelkod. Komplett programkod delas som kan användas för att utveckla denna applikation eftersom alla nödvändiga klasser och metoder tillhandahålls som behövs för att få bilder från PDF i Python i olika format som PNG, JPEG, etc. Du kommer också att se olika alternativ för att förbättra processen genom att anpassa de genererade bilderna efter att du har kommit åt dem från filen PDF.
Steg för att få PDF-bilder i Python
- Konfigurera IDE att använda Aspose.PDF för Python via .NET för att extrahera bilder från en PDF
- Få åtkomst till PDF-källfilen med bilder i den med hjälp av klassobjektet Document
- Få åtkomst till en viss bild i sidresurserna med klassobjektet XImage
- Skapa en ny filström med namnet på den önskade bilden
- Spara bilden som en JPEG-fil på disken
Dessa steg innebär hur man får bilder från PDF i Python genom att exponera ett steg-för-steg tillvägagångssätt där vi först öppnar käll-PDF-filen och sedan kommer åt en viss sida i PDF-filen. För varje PDF-sida finns en samling resurser inklusive bilder som kan refereras till med hjälp av ett index. När den önskade bildreferensen har nåtts med en instans av XImage-klassobjektet kan den sparas som en bild på disken med hjälp av en instans av minnesströmmen.
Kod för att hämta en bild från en PDF i Python
Den här koden visar proceduren för att få ut bilden från PDF i Python genom att komma åt den i dokumentklassobjektet och sedan ladda åtkomst till den önskade bilden på en viss sida genom att komma åt dess lista med resurser När vi har tillgång till den önskade bilden, kan byta namn på den och kan även göra ändringar i referenserna i dokumentet. Du kan också komma åt olika egenskaper som namn, bredd och höjd för att filtrera bilderna innan du sparar dem som en fil på disken.
Det här exemplet har väglett oss att extrahera bilder från en PDF-sida. Om du är intresserad av att lära dig mer om processen för att lägga till en vattenstämpel i en PDF-fil, se artikeln om hur man lägger till vattenstämpel till PDF i Python.