Denna snabba guide förklarar hur man extraherar en tabell från PDF till Excel med Java. Du får information för att konfigurera miljön, en lista med steg och ett exempel på kod för att hämta tabell från PDF till Excel med Java. Alla nödvändiga detaljer demonstreras för att komma åt varje tabell på någon PDF-sida, hämta text från alla celler och kopiera innehållet till respektive cell i den resulterande arbetsboken.
Steg för att extrahera tabell från PDF till Excel med Java
- Ställ in miljön för att använda Aspose.Total for Java för att extrahera PDF‑tabellen till Excel‑bladet
- Använd Aspose.Totallicensen för Aspose‑produkterna.PDF och Aspose.Cells
- Ladda käll‑PDF‑filen i Document‑klassobjektet
- Skapa en tom Excel‑fil med Workbook‑klassen från Aspose.Cells
- Gå igenom varje sida i PDF-filen och hämta tabellsamlingen på varje sida
- Gå igenom alla sidor och kom åt varje cell en efter en
- Hämta text från varje cell och spara innehållet till motsvarande rad och kolumn i destinationsarket
- Anpassa kolumnerna i bladet automatiskt och spara den resulterande Excel-filen
Följ dessa steg för att hämta tabell från PDF till Excel med Java. Påbörja processen genom att ladda den ursprungliga PDF-filen, komma åt alla sidor i den, parsning av varje sida separat, hämta samlingen av tabeller på varje sida och komma åt varje cell i den valda tabellen. Kombinera texten i en cell till en sträng och spara innehållet i motsvarande rad och kolumn på det specifika bladet i den resulterande Excel-filen.
Kod för att extrahera Excel‑tabell från PDF med Java
Den här koden demonstrerar hur man extraherar data från PDF‑tabell till Excel med Java. Käll-PDF:ens textformat kan tillämpas på Excel-arkets tabell genom att hämta PDF-tabellens cellfärg, fet/kursiv stil, typsnittsnamn och storlek, och sätta samma i Excel-cellen när innehållet skrivs. Var försiktig när du hanterar sammanslagna tabeller i PDF:en och skapar samma i Excel-filen för att hålla tabellinnehållets organisation densamma.
Denna artikel beskriver processen att kopiera text från en PDF‑tabell till en Excel‑arktabell. För att konvertera en skannad PDF till en redigerbar PDF, se artikeln Konvertera skannad PDF till redigerbar PDF med Java.