既存のPDFからテーブルを削除する

Aspose.PDF for Python via .NETは、PDFドキュメントが最初から生成される際に、ドキュメント内にテーブルを挿入または作成する機能を提供します。また、既存のPDFドキュメントにテーブルオブジェクトを追加することもできます。ただし、既存のテーブルセルの内容を更新できる既存のPDF内のテーブルを操作する必要があるかもしれません。しかし、既存のPDFドキュメントからテーブルオブジェクトを削除する必要がある場合もあります。

テーブルを削除するためには、既存のPDF内のテーブルを取得するためにTableAbsorberクラスを使用し、それからremove()を呼び出す必要があります。

PDFドキュメントからテーブルを削除

新しい関数を追加しました。すなわち、 remove() を既存の TableAbsorber クラスに追加して、PDF ドキュメントからテーブルを削除します。アブソーバーがページ上でテーブルを正常に検出すると、それらを削除できるようになります。以下のコードスニペットを確認して、PDF ドキュメントからテーブルを削除する方法を示します。


    import aspose.pdf as ap

    # 既存のPDFドキュメントを読み込む
    pdf_document = ap.Document(input_file)
    # テーブルを見つけるためにTableAbsorberオブジェクトを作成する
    absorber = ap.text.TableAbsorber()
    # アブソーバーで最初のページを訪問する
    absorber.visit(pdf_document.pages[1])
    # ページ上の最初のテーブルを取得する
    table = absorber.table_list[0]
    # テーブルを削除する
    absorber.remove(table)
    # PDFを保存する
    pdf_document.save(output_file)

PDF ドキュメントから複数のテーブルを削除する

時々、PDF ドキュメントには複数のテーブルが含まれていることがあり、それらを削除する必要が出てくることがあります。複数のテーブルをPDFドキュメントから削除するためには、以下のコードスニペットを使用してください：


    import aspose.pdf as ap

    # 既存のPDFドキュメントを読み込む
    pdf_document = ap.Document(input_file)
    # テーブルを見つけるためのTableAbsorberオブジェクトを作成
    absorber = ap.text.TableAbsorber()
    # アブソーバーで2ページ目を訪問
    absorber.visit(pdf_document.pages[1])
    # テーブルコレクションのコピーを取得
    tables = absorber.table_list
    # コレクションのコピーをループし、テーブルを削除
    for table in tables:
        absorber.remove(table)
    # ドキュメントを保存
    pdf_document.save(output_file)

既存のPDF内のテーブルを操作する