استخراج جدول من مستند PDF
Contents
[
Hide
]
استخراج جدول من PDF
يمكن أن يكون استخراج الجداول من ملفات PDF باستخدام Python مفيدًا للغاية لاستخراج البيانات وتحليلها. مع مكتبة Aspose.PDF لـ Python عبر .NET، يمكنك العمل بكفاءة مع الجداول المدمجة في مستندات PDF لمهام مختلفة متعلقة بالبيانات.
import aspose.pdf as ap
# تحميل مستند PDF المصدر
pdf_document = ap.Document(input_file)
for page in pdf_document.pages:
absorber = ap.text.TableAbsorber()
absorber.visit(page)
for table in absorber.table_list:
for row in table.row_list:
for cell in row.cell_list:
text_fragment_collection = cell.text_fragments
for fragment in text_fragment_collection:
txt = ""
for seg in fragment.segments:
txt += seg.text
print(txt)