استخراج جدول من مستند PDF

استخراج جدول من PDF

يمكن أن يكون استخراج الجداول من ملفات PDF باستخدام Python مفيدًا للغاية لاستخراج البيانات وتحليلها. مع مكتبة Aspose.PDF لـ Python عبر .NET، يمكنك العمل بكفاءة مع الجداول المدمجة في مستندات PDF لمهام مختلفة متعلقة بالبيانات.


    import aspose.pdf as ap

    # تحميل مستند PDF المصدر
    pdf_document = ap.Document(input_file)
    for page in pdf_document.pages:
        absorber = ap.text.TableAbsorber()
        absorber.visit(page)
        for table in absorber.table_list:
            for row in table.row_list:
                for cell in row.cell_list:
                    text_fragment_collection = cell.text_fragments
                    for fragment in text_fragment_collection:
                        txt = ""
                        for seg in fragment.segments:
                            txt += seg.text
                        print(txt)