Denna artikel beskriver hur man extraherar en tabell från PDF till Excel med Python. Den innehåller alla detaljer för att använda båda produkterna, dvs. Aspose.PDF och Aspose.Cells, en lista med steg och ett kodexempel för att extrahera en Excel‑tabell från PDF med Python. Exempelkoden visar hela processen genom att överföra tabellen från en PDF‑sida till ett Excel‑ark.
Steg för att extrahera en tabell från PDF till Excel med Python
- Ställ in miljön för att installera Aspose.Total For Python via .NET
- Applicera licensen för de relevanta importerade biblioteken, dvs. Aspose.Celler och Aspose.PDF
- Ladda käll‑PDF‑filen med tabeller med hjälp av klassobjektet Document.
- Skapa en tom Excel‑fil med klassen Workbook och ge det första bladet ett namn.
- Iterera genom varje sida i samlingen av sidor i PDF-filen
- Åtkomst till samlingen av tabeller och parsa varje cell i tabellen
- Hämta text från PDF‑cellen och kopiera den till motsvarande cell i Excel‑arket
- Spara Excel‑filen på disken med tabelldata från PDF
Dessa steg omfattar processen att extrahera data från en PDF‑tabell till Excel med Python. Importera de nödvändiga biblioteken, ladda käll‑PDF‑filen, öppna varje sida och samling av tabeller på den, och gå igenom alla tabeller. Slutligen, öppna varje cell i en PDF‑tabell och spara dess innehåll i motsvarande cell i den resulterande Excel‑arbetsboken.
Kod för att hämta tabell från PDF till Excel med Python
Den här koden visar hur man hämtar tabell från PDF till Excel med Python. Du kan prova en annan tabelligenkänningsmotor genom att använda use_flow_engine‑alternativet i TableAbsorber‑klassen för att upptäcka kantlösa tabeller i PDF‑filen. Använd text_state i den absorberade cellen för att hämta teckensnittets namn, storlek, bakgrundsfärg, förgrundsfärg och fet kursiv stil för att anpassa destinationens Excel‑cellformat så att tabellernas format förblir liknande i båda filerna.
Denna artikel har hjälpt till att förstå processen att överföra en PDF‑tabell till Excel. För att installera Python för att köra Aspose.PDF för Python via.NET, se artikeln [Hur man installerar Python för att köra Aspose].PDF för Python via .NET]( https://kb-qa.aspose.com/ sv/total/python/how-to-install-python-to-run-aspose-pdf-for-python-via-net/).