Tabelle aus PDF nach Excel mit Java extrahieren

Dieser Schnellleitfaden erklärt, wie man eine Tabelle von PDF bis Excel mit Java extrahiert. Sie erhalten Informationen zur Einrichtung der Umgebung, eine Schritt‑für‑Schritt‑Liste und einen Beispielcode, um eine Tabelle aus PDF in Excel mit Java zu übertragen. Alle notwendigen Details werden gezeigt, um jede Tabelle auf jeder PDF‑Seite zuzugreifen, den Text aus allen Zellen zu erhalten und den Inhalt in die jeweilige Zelle im Ausgabearbeitsbuch zu kopieren.

Schritte zum Extrahieren von Tabellen aus PDF nach Excel mit Java

  1. Stellen Sie die Umgebung so ein, dass Aspose.Total for Java verwendet wird, um die PDF‑Tabelle in das Excel‑Blatt zu extrahieren.
  2. Wenden Sie die Aspose.Total‑Lizenz für die Produkte Aspose.PDF und Aspose.Zellen an
  3. Laden Sie die Quell‑PDF‑Datei in das Klassenobjekt Document
  4. Erstellen Sie eine leere Excel-Datei mit der Workbook-Klasse von Aspose.Cells
  5. Durchsuche jede Seite im PDF und greife auf die Tabellensammlung jeder Seite zu.
  6. Durchlaufen Sie alle Seiten und greifen Sie jede Zelle einzeln ab
  7. Text aus jeder Zelle abrufen und den Inhalt in die entsprechende Zeile und Spalte im Zielblatt speichern.
  8. Passe die Spaltenbreite im Blatt automatisch an und speichere die ausgegebene Excel‑Datei

Folgen Sie diesen Schritten, um eine Tabelle aus einer PDF‑Datei nach Excel mit Java zu erhalten. Beginnen Sie den Vorgang, indem Sie die Quell‑PDF‑Datei laden, auf alle Seiten darin zugreifen, jede Seite einzeln parsen, die Sammlung von Tabellen auf jeder Seite erhalten und auf jede Zelle in der ausgewählten Tabelle zugreifen. Kombinieren Sie den Text innerhalb einer Zelle zu einem String und speichern Sie den Inhalt in der jeweiligen Zeile und Spalte im entsprechenden Blatt der Ausgabedatei Excel.

Code zum Extrahieren einer Excel‑Tabelle aus PDF mit Java

Dieser Code demonstriert, wie man Daten aus einer PDF‑Tabelle nach Excel mit Java extrahiert. Das Quell‑PDF‑Textformat kann auf die Excel‑Tabellenspalte angewendet werden, indem die Farbe der PDF‑Tabellenzelle, fette/kursive Formatierung, Schriftname und -größe abgerufen und dieselben Einstellungen in die Excel‑Zelle übernommen werden, während der Inhalt geschrieben wird. Achten Sie darauf, beim Umgang mit zusammengeführten Tabellen im PDF und deren Erstellung in der Excel‑Datei die Organisation des Tabelleninhalts beizubehalten.

Dieser Artikel erklärt den Vorgang, Text aus einer PDF‑Tabelle in eine Excel‑Tabellenvorlage zu kopieren. Um ein gescanntes PDF in ein bearbeitbares PDF zu konvertieren, siehe den Artikel Gescanntes PDF in bearbeitbares PDF mit Java konvertieren.

 Deutsch