Tento rychlý průvodce vysvětluje, jak extrahovat tabulku z PDF do Excel pomocí Javy. Získáte informace o nastavení prostředí, seznam kroků a ukázkový kód k přetažení tabulky z PDF do Excelu pomocí Javy. Všechny potřebné podrobnosti jsou demonstrovány pro přístup k každé tabulce na libovolné stránce PDF, přístup k textu ze všech buněk a kopírování obsahu do příslušné buňky ve výstupním sešitu.
Kroky k extrakci tabulky z PDF do Excelu pomocí Javy
- Nastavte prostředí tak, aby používalo Aspose.Total for Java k extrakci tabulky PDF do listu Excel
- Použijte licenci Aspose.Celkem pro produkty Aspose.PDF a Aspose.Cells
- Načtěte zdrojový PDF soubor do objektu třídy Document
- Vytvořte prázdný soubor Excel pomocí třídy Workbook z Aspose.Cells
- Procházejte každou stránku PDF a přistupujte ke kolekci tabulek na každé stránce
- Procházejte všechny stránky a přistupujte k jednotlivým buňkám po jedné
- Načtěte text z každé buňky a uložte obsah do příslušného řádku a sloupce v cílovém listu
- Automaticky přizpůsobte sloupce v listu a uložte výstupní soubor Excel
Postupujte podle těchto kroků k získání tabulky z PDF do Excelu pomocí Javy. Zahajte proces načtením zdrojového PDF souboru, přístupem ke všem jeho stránkám, parsováním každé stránky zvlášť, získáním kolekce tabulek na každé stránce a přístupem k jednotlivým buňkám ve vybrané tabulce. Spojte text v buňce do řetězce a uložte obsah do příslušného řádku a sloupce na konkrétním listu výstupního Excel souboru.
Kód pro extrakci tabulky Excel z PDF pomocí Javy
Tento kód ukazuje, jak extrahovat data z PDF tabulky do Excelu pomocí Javy. Formát textu ze zdrojového PDF lze aplikovat na tabulku v listu Excelu tím, že se získá barva buňky PDF tabulky, styl tučného/kurzivního písma, název a velikost fontu, a nastaví se to samé v buňce Excelu při zápisu obsahu. Dbejte na správné zacházení se sloučenými tabulkami v PDF a jejich vytvoření v souboru Excel, aby organizace obsahu tabulky zůstala stejná.
Tento článek popisuje proces kopírování textu z tabulky PDF do tabulky v Excelu. Pro převod naskenovaného PDF na editovatelné PDF se podívejte na článek Převést naskenované PDF na editovatelné PDF pomocí Javy.