Αυτός ο γρήγορος οδηγός εξηγεί πώς να εξάγετε έναν πίνακα από PDF έως Excel χρησιμοποιώντας Java. Θα λάβετε πληροφορίες για τη ρύθμιση του περιβάλλοντος, μια λίστα βημάτων και ένα δείγμα κώδικα για να μεταφέρετε τον πίνακα από PDF σε Excel χρησιμοποιώντας Java. Όλες οι απαραίτητες λεπτομέρειες παρουσιάζονται για την πρόσβαση σε κάθε πίνακα σε οποιαδήποτε σελίδα PDF, την ανάκτηση κειμένου από όλα τα κελιά και την αντιγραφή του περιεχομένου στο αντίστοιχο κελί του τελικού Workbook.
Βήματα για την εξαγωγή πίνακα από PDF σε Excel χρησιμοποιώντας Java
- Ορίστε το περιβάλλον ώστε να χρησιμοποιεί το Aspose.Total for Java για την εξαγωγή του πίνακα PDF στο φύλλο Excel
- Εφαρμόστε την άδεια Aspose.Total για τα προϊόντα Aspose.PDF και Aspose.Cells
- Φορτώστε το αρχείο PDF προέλευσης στο αντικείμενο κλάσης Document
- Δημιουργήστε ένα κενό αρχείο Excel χρησιμοποιώντας την κλάση Workbook από το Aspose.Cells
- Διαβάστε κάθε σελίδα στο PDF και αποκτήστε πρόσβαση στη συλλογή πινάκων σε κάθε σελίδα
- Επανάληψη σε όλες τις σελίδες και πρόσβαση σε κάθε κελί ένα‑ένα
- Ανάκτηση κειμένου από κάθε κελί και αποθήκευση του περιεχομένου στη αντίστοιχη γραμμή και στήλη στο φύλλο προορισμού
- Αυτόματη προσαρμογή των στηλών στο φύλλο και αποθήκευση του εξαγόμενου αρχείου Excel
Ακολουθήστε αυτά τα βήματα για να εξάγετε πίνακα από PDF σε Excel χρησιμοποιώντας Java. Ξεκινήστε τη διαδικασία φορτώνοντας το αρχικό αρχείο PDF, προσπερνώντας όλες τις σελίδες του, αναλύοντας κάθε σελίδα ξεχωριστά, λαμβάνοντας τη συλλογή των πινάκων σε κάθε σελίδα και προσπερνώντας κάθε κελί στον επιλεγμένο πίνακα. Συνδυάστε το κείμενο μέσα σε ένα κελί σε συμβολοσειρά και αποθηκεύστε το περιεχόμενο στη αντίστοιχη γραμμή και στήλη στο συγκεκριμένο φύλλο του εξαγόμενου αρχείου Excel.
Κώδικας για την εξαγωγή πίνακα Excel από PDF με χρήση Java
Αυτός ο κώδικας δείχνει πώς να εξάγετε δεδομένα από πίνακα PDF σε Excel χρησιμοποιώντας Java. Η μορφή κειμένου του πηγαίου PDF μπορεί να εφαρμοστεί στον πίνακα φύλλου Excel ανακτώντας το χρώμα των κελιών του πίνακα PDF, το στυλ έντονο/πλάγιο, το όνομα και το μέγεθος της γραμματοσειράς, και ορίζοντας τα ίδια στο κελί του Excel κατά τη συγγραφή του περιεχομένου. Προσέξτε κατά τη διαχείριση των συγχωνευμένων πινάκων στο PDF και τη δημιουργία τους στο αρχείο Excel ώστε η οργάνωση του περιεχομένου των πινάκων να παραμείνει η ίδια.
Αυτό το άρθρο διδάσκει τη διαδικασία αντιγραφής κειμένου από έναν πίνακα PDF σε έναν πίνακα φύλλου Excel. Για να μετατρέψετε ένα σαρωμένο PDF σε επεξεργάσιμο PDF, ανατρέξτε στο άρθρο Convert scanned PDF to editable PDF using Java.