提取 AcroForm - 在 Python 中从 PDF 提取表单数据

从表单中提取数据

获取 PDF 文档中所有字段的值

要从 PDF 文档中获取所有字段的值,需要遍历所有表单字段,然后使用 Value 属性获取值。从基础字段类型 Field 的 Form 集合中获取每个字段,并访问其 value 属性。

以下 Python 代码片段展示了如何获取 PDF 文档中所有字段的值。


    import aspose.pdf as ap

    # 打开文档
    pdfDocument = ap.Document(input_file)

    # 从所有字段获取值
    for formField in pdfDocument.form.fields:
        # 如果需要,分析名称和值
        print("字段名称 : " + formField.partial_name)
        print("值 : " + str(formField.value))