این مقاله توضیح میدهد که چگونه یک جدول را از PDF به Excel با استفاده از Python استخراج کنید. این مقاله تمام جزئیات لازم برای استفاده از هر دو محصول، یعنی Aspose.PDF و Aspose.Cells، فهرستی از مراحل، و یک کد نمونه برای استخراج جدول Excel از PDF با استفاده از Python را دارد. کد نمونه فرآیند کامل را با انتقال جدول از یک صفحه PDF به یک شیت Excel نشان میدهد.
مراحل استخراج جدول از PDF به Excel با استفاده از پایتون
- محیط را برای نصب Aspose.Total For Python via .NET تنظیم کنید
- مجوز را برای کتابخانههای وارد شده مرتبط اعمال کنید، یعنی Aspose.سلولها و Aspose.PDF ۳. فایل PDF منبع حاوی جداول را با استفاده از شیء کلاس Document بارگذاری کنید
- یک فایل Excel خالی با استفاده از کلاس Workbook ایجاد کنید و برای اولین شیت نامی تعیین کنید.
- در هر صفحه از مجموعه صفحات موجود در فایل PDF تکرار کنید
- به مجموعه جداول دسترسی پیدا کنید و هر سلول جدول را تجزیه کنید
- متن را از سلول PDF دریافت کنید و آن را در سلول مربوطه در شیت Excel کپی کنید
- فایل Excel را با دادههای جدول از PDF بر روی دیسک ذخیره کنید
این مراحل شامل فرآیند استخراج دادهها از جدول PDF به Excel با استفاده از Python است. کتابخانههای لازم را وارد کنید، فایل PDF منبع را بارگذاری کنید، به هر صفحه و مجموعه جداول موجود در آن دسترسی پیدا کنید و تمام جداول را تجزیه و تحلیل کنید. در نهایت، به هر سلول در یک جدول PDF دسترسی پیدا کنید و محتوای آن را در سلول مربوطه در برگه خروجی Excel ذخیره کنید.
کد برای استخراج جدول از PDF به Excel با استفاده از پایتون
این کد نشان میدهد چگونه جدول را از PDF به Excel با استفاده از پایتون استخراج کنیم. میتوانید با استفاده از گزینه use_flow_engine در کلاس TableAbsorber یک موتور تشخیص جدول متفاوت را برای شناسایی جداول بدون حاشیه در PDF امتحان کنید. از text_state در سلول جذبشده برای دریافت نام فونت، اندازه، رنگ پسزمینه، رنگ پیشزمینه و سبک بولد ایتالیک استفاده کنید تا قالب سلول مقصد در Excel را سفارشی کنید و فرمت جداول را در هر دو فایل مشابه نگه دارید.
این مقاله به درک فرآیند انتقال جدول PDF به Excel کمک کرده است. برای نصب Python به منظور اجرای Aspose.PDF برای Python از طریق .NET، به مقاله نحوه نصب Python برای اجرای Aspose.PDF برای Python از طریق .NET مراجعه کنید.