Κάποιος μπορεί να εξαγάγει το Text από το έγγραφο του Word σε Java ανατρέχοντας σε αυτό το απλό άρθρο. Περιλαμβάνει τα απαιτούμενα βήματα για τη ρύθμιση του περιβάλλοντος ανάπτυξης, τη σταδιακή ροή εργασίας του προγράμματος και ένα εκτελούμενο παράδειγμα κώδικα για μετατροπή του DOCX σε TXT σε Java. Η αναπτυγμένη εφαρμογή μπορεί να χρησιμοποιηθεί σε οποιοδήποτε περιβάλλον που υποστηρίζεται από Java σε Linux, MS Windows ή macOS.
Βήματα για την ανάπτυξη μετατροπέα Word σε TXT χρησιμοποιώντας Java
- Διαμορφώστε το περιβάλλον εγκαθιστώντας το Aspose.Words for Java από τη διαχείριση αποθετηρίου για να μετατρέψετε ένα αρχείο DOCX σε αρχείο TXT χρησιμοποιώντας Java
- Ανοίξτε το έγγραφο πηγής Word δημιουργώντας μια παρουσία της κλάσης Document για μετατροπή αρχείου Word σε TXT
- Δημιουργήστε ένα αντικείμενο κλάσης TxtSaveOptions για να ορίσετε τις απαιτούμενες ιδιότητες αρχείου εξόδου TXT
- Αποθηκεύστε το φορτωμένο αρχείο DOCX ως αρχείο TXT στο δίσκο χρησιμοποιώντας τη μέθοδο αποθήκευσης
Αυτά τα ακριβή βήματα στο Java εξαγωγή κειμένου από το έγγραφο του Word χρησιμοποιώντας μια απλή διεπαφή API. Αρχικά, θα φορτώσουμε το αρχείο προέλευσης DOCX από το δίσκο χρησιμοποιώντας μια παρουσία της κλάσης Document, η οποία στη συνέχεια ακολουθείται από τη ρύθμιση των επιθυμητών επιλογών εξαγωγής αρχείου TXT εξόδου χρησιμοποιώντας μια παρουσία της κλάσης TxtSaveOptions. Τέλος, το ανοιχτό έγγραφο του Word αποθηκεύεται ως αρχείο TXT στο δίσκο χρησιμοποιώντας τη μέθοδο αποθήκευσης.
Κώδικας για μετατροπή DOCX σε TXT σε Java
Για πρόσβαση στην πηγή DOCX από το δίσκο και εξαγωγή κειμένου από το έγγραφο Word έχει χρησιμοποιηθεί API που βασίζεται σε Java στο προαναφερθέν παράδειγμα κώδικα. Κάποιος μπορεί να αποθηκεύσει ένα αρχείο TXT στο δίσκο χωρίς να βασίζεται στην προαιρετική παρουσία κλάσης TxtSaveOptions. Ωστόσο, εάν θέλετε να προσαρμόσετε το επιθυμητό αρχείο TXT, μπορείτε να χρησιμοποιήσετε διαφορετικές μεθόδους ρυθμιστή που εκτίθενται από την κλάση TxtSaveOptions, συμπεριλαμβανομένων setEncoding(), setForcePageBreaks(), setMaxCharactersPerLine(), setParagraphBreak() και setPrettyFormat() για να αναφέρετε μερικές.
Αυτό το άρθρο μας διαφώτισε να αναπτύξουμε έναν μετατροπέα Word σε TXT χρησιμοποιώντας Java. Εάν ενδιαφέρεστε να συγκρίνετε έγγραφα του Word, ανατρέξτε στο άρθρο σχετικά με το Συγκρίνετε έγγραφα του Word χρησιμοποιώντας Java.