Wyodrębnij tabelę z PDF do Excela przy użyciu Pythona

Ten artykuł opisuje, jak wyodrębnić tabelę z PDF do Excel przy użyciu Pythona. Zawiera wszystkie szczegóły potrzebne do wykorzystania obu produktów, tj. Aspose.PDF i Aspose.Komórki, listę kroków oraz przykładowy kod do wyodrębnienia tabeli Excel z PDF przy użyciu Pythona. Przykładowy kod pokaże kompletny proces przenoszenia tabeli z strony PDF do arkusza Excel.

Kroki do wyodrębniania tabeli z PDF do Excela przy użyciu Pythona

  1. Ustaw środowisko, aby zainstalować Aspose.Total For Python via .NET
  2. Zastosuj licencję dla odpowiednich importowanych bibliotek, tj. Aspose.Komórki i Aspose.PDF
  3. Załaduj plik PDF źródłowy z tabelami przy użyciu obiektu klasy Document
  4. Utwórz pusty plik Excel przy użyciu klasy Workbook i ustaw nazwę pierwszego arkusza
  5. Przejdź przez każdą stronę w kolekcji stron w pliku PDF
  6. Uzyskaj dostęp do kolekcji tabel i przeanalizuj każdą komórkę w tabeli
  7. Pobierz tekst z komórki PDF i skopiuj go do odpowiedniej komórki w arkuszu Excel
  8. Zapisz plik Excel na dysku z danymi tabeli z pliku PDF

Te kroki obejmują proces wyodrębniania danych z tabeli PDF do Excela przy użyciu Pythona. Zaimportuj niezbędne biblioteki, wczytaj źródłowy plik PDF, uzyskaj dostęp do każdej strony i zbioru tabel w niej, oraz przeanalizuj wszystkie tabele. Na koniec uzyskaj dostęp do każdej komórki w tabeli PDF i zapisz jej zawartość w odpowiedniej komórce w wyjściowym arkuszu Excel.

Kod do pobierania tabeli z PDF do Excela przy użyciu Pythona

Ten kod demonstruje, jak pobrać tabelę z PDF do Excela przy użyciu Pythona. Możesz wypróbować inny silnik rozpoznawania tabel, używając opcji use_flow_engine w klasie TableAbsorber, aby wykrywać tabele bez ramek w PDF. Użyj właściwości text_state w absorbowanej komórce, aby pobrać nazwę czcionki, rozmiar, kolor tła, kolor pierwszego planu oraz styl pogrubiony i kursywa, i dostosować format docelowej komórki w Excelu, aby zachować podobne formatowanie tabel w obu plikach.

Ten artykuł pomógł w zrozumieniu procesu przenoszenia tabeli PDF do Excela. Aby zainstalować Pythona do uruchamiania Aspose.PDF dla Pythona za pośrednictwem ..NET, odwołaj się do artykułu „Jak zainstalować Pythona, aby uruchomić Aspose”.PDF dla Pythona za pośrednictwem .NET]( https://kb-qa.aspose.com/ pl/total/python/how-to-install-python-to-run-aspose-pdf-for-python-via-net/).

 Polski