استخراج جدول از PDF به Excel با استفاده از Python

این مقاله توضیح می‌دهد که چگونه یک جدول را از PDF به Excel با استفاده از Python استخراج کنید. این مقاله تمام جزئیات لازم برای استفاده از هر دو محصول، یعنی Aspose.PDF و Aspose.Cells، فهرستی از مراحل، و یک کد نمونه برای استخراج جدول Excel از PDF با استفاده از Python را دارد. کد نمونه فرآیند کامل را با انتقال جدول از یک صفحه PDF به یک شیت Excel نشان می‌دهد.

مراحل استخراج جدول از PDF به Excel با استفاده از پایتون

  1. محیط را برای نصب Aspose.Total For Python via .NET تنظیم کنید
  2. مجوز را برای کتابخانه‌های وارد شده مرتبط اعمال کنید، یعنی Aspose.سلول‌ها و Aspose.PDF ۳. فایل PDF منبع حاوی جداول را با استفاده از شیء کلاس Document بارگذاری کنید
  3. یک فایل Excel خالی با استفاده از کلاس Workbook ایجاد کنید و برای اولین شیت نامی تعیین کنید.
  4. در هر صفحه از مجموعه صفحات موجود در فایل PDF تکرار کنید
  5. به مجموعه جداول دسترسی پیدا کنید و هر سلول جدول را تجزیه کنید
  6. متن را از سلول PDF دریافت کنید و آن را در سلول مربوطه در شیت Excel کپی کنید
  7. فایل Excel را با داده‌های جدول از PDF بر روی دیسک ذخیره کنید

این مراحل شامل فرآیند استخراج داده‌ها از جدول PDF به Excel با استفاده از Python است. کتابخانه‌های لازم را وارد کنید، فایل PDF منبع را بارگذاری کنید، به هر صفحه و مجموعه جداول موجود در آن دسترسی پیدا کنید و تمام جداول را تجزیه و تحلیل کنید. در نهایت، به هر سلول در یک جدول PDF دسترسی پیدا کنید و محتوای آن را در سلول مربوطه در برگه خروجی Excel ذخیره کنید.

کد برای استخراج جدول از PDF به Excel با استفاده از پایتون

این کد نشان می‌دهد چگونه جدول را از PDF به Excel با استفاده از پایتون استخراج کنیم. می‌توانید با استفاده از گزینه use_flow_engine در کلاس TableAbsorber یک موتور تشخیص جدول متفاوت را برای شناسایی جداول بدون حاشیه در PDF امتحان کنید. از text_state در سلول جذب‌شده برای دریافت نام فونت، اندازه، رنگ پس‌زمینه، رنگ پیش‌زمینه و سبک بولد ایتالیک استفاده کنید تا قالب سلول مقصد در Excel را سفارشی کنید و فرمت جداول را در هر دو فایل مشابه نگه دارید.

این مقاله به درک فرآیند انتقال جدول PDF به Excel کمک کرده است. برای نصب Python به منظور اجرای Aspose.PDF برای Python از طریق .NET، به مقاله نحوه نصب Python برای اجرای Aspose.PDF برای Python از طریق .NET مراجعه کنید.

 فارسی