Ten szybki przewodnik wyjaśnia, jak wyodrębnić tabelę z PDF do Excel przy użyciu Javy. Otrzymasz informacje, jak skonfigurować środowisko, listę kroków oraz przykładowy kod do pobrania tabeli z PDF do Excela przy użyciu Javy. Wszystkie niezbędne szczegóły są przedstawione, aby uzyskać dostęp do każdej tabeli na dowolnej stronie PDF, odczytać tekst ze wszystkich komórek i skopiować zawartość do odpowiedniej komórki w wyjściowym skoroszycie.
Kroki wyodrębniania tabeli z PDF do Excela w Javie
- Ustaw środowisko, aby używać Aspose.Total for Java do wyodrębnienia tabeli PDF do arkusza Excel
- Zastosuj licencję Aspose.Łączna kwota dla produktów Aspose.PDF i Aspose.Cells
- Załaduj plik PDF źródłowy do obiektu klasy Document
- Utwórz pusty plik Excel przy użyciu klasy Workbook z Aspose.Cells
- Przejrzyj każdą stronę w pliku PDF i uzyskaj dostęp do kolekcji tabel na każdej stronie
- Iteruj po wszystkich stronach i uzyskaj dostęp do każdej komórki po jednej
- Pobierz tekst z każdej komórki i zapisz zawartość w odpowiednim wierszu i kolumnie w docelowym arkuszu
- Dopasuj automatycznie kolumny w arkuszu i zapisz wyjściowy plik Excel
Postępuj zgodnie z poniższymi krokami, aby pobrać tabelę z PDF do Excela przy użyciu Javy. Rozpocznij proces od załadowania źródłowego pliku PDF, uzyskania dostępu do wszystkich jego stron, parsowania każdej strony osobno, pobrania kolekcji tabel na każdej stronie oraz dostępu do każdej komórki w wybranej tabeli. Połącz tekst w komórce w ciąg znaków i zapisz zawartość w odpowiednim wierszu i kolumnie na konkretnej karcie wyjściowego pliku Excel.
Kod do wyodrębniania tabeli Excel z PDF w Javie
Ten kod demonstruje, jak wyodrębnić dane z tabeli PDF do Excela przy użyciu Javy. Format tekstu źródłowego PDF może być zastosowany w tabeli arkusza Excel poprzez pobranie koloru komórki tabeli PDF, stylu pogrubienia/pochylenia, nazwy i rozmiaru czcionki oraz ustawienie tych samych właściwości w komórce Excela podczas zapisywania treści. Należy zachować ostrożność przy obsłudze scalonych tabel w PDF i tworzeniu ich w pliku Excel, aby zachować taką samą organizację zawartości tabeli.
Ten artykuł opisuje proces kopiowania tekstu z tabeli PDF do tabeli w arkuszu Excel. Aby przekonwertować zeskanowany PDF na edytowalny PDF, odwołaj się do artykułu Konwertuj zeskanowany PDF na edytowalny PDF przy użyciu Javy.