既存のPDFからテーブルを削除する

テーブルを削除するためには、既存のPDF内のテーブルを取得するためにTableAbsorberクラスを使用し、それからremove()を呼び出す必要があります。

PDFドキュメントからテーブルを削除

新しい関数を追加しました。すなわち、 remove() を既存の TableAbsorber クラスに追加して、PDF ドキュメントからテーブルを削除します。アブソーバーがページ上でテーブルを正常に検出すると、それらを削除できるようになります。以下のコードスニペットを確認して、PDF ドキュメントからテーブルを削除する方法を示します。


    import aspose.pdf as ap

    # 既存のPDFドキュメントを読み込む
    pdf_document = ap.Document(input_file)
    # テーブルを見つけるためにTableAbsorberオブジェクトを作成する
    absorber = ap.text.TableAbsorber()
    # アブソーバーで最初のページを訪問する
    absorber.visit(pdf_document.pages[1])
    # ページ上の最初のテーブルを取得する
    table = absorber.table_list[0]
    # テーブルを削除する
    absorber.remove(table)
    # PDFを保存する
    pdf_document.save(output_file)

PDF ドキュメントから複数のテーブルを削除する

時々、PDF ドキュメントには複数のテーブルが含まれていることがあり、それらを削除する必要が出てくることがあります。 複数のテーブルをPDFドキュメントから削除するためには、以下のコードスニペットを使用してください:


    import aspose.pdf as ap

    # 既存のPDFドキュメントを読み込む
    pdf_document = ap.Document(input_file)
    # テーブルを見つけるためのTableAbsorberオブジェクトを作成
    absorber = ap.text.TableAbsorber()
    # アブソーバーで2ページ目を訪問
    absorber.visit(pdf_document.pages[1])
    # テーブルコレクションのコピーを取得
    tables = absorber.table_list
    # コレクションのコピーをループし、テーブルを削除
    for table in tables:
        absorber.remove(table)
    # ドキュメントを保存
    pdf_document.save(output_file)