既存のPDFからテーブルを削除する
Contents
[
Hide
]
Aspose.PDF for Python via .NETは、PDFドキュメントが最初から生成される際に、ドキュメント内にテーブルを挿入または作成する機能を提供します。また、既存のPDFドキュメントにテーブルオブジェクトを追加することもできます。ただし、既存のテーブルセルの内容を更新できる既存のPDF内のテーブルを操作する必要があるかもしれません。しかし、既存のPDFドキュメントからテーブルオブジェクトを削除する必要がある場合もあります。
テーブルを削除するためには、既存のPDF内のテーブルを取得するためにTableAbsorberクラスを使用し、それからremove()を呼び出す必要があります。
PDFドキュメントからテーブルを削除
新しい関数を追加しました。すなわち、 remove() を既存の TableAbsorber クラスに追加して、PDF ドキュメントからテーブルを削除します。アブソーバーがページ上でテーブルを正常に検出すると、それらを削除できるようになります。以下のコードスニペットを確認して、PDF ドキュメントからテーブルを削除する方法を示します。
import aspose.pdf as ap
# 既存のPDFドキュメントを読み込む
pdf_document = ap.Document(input_file)
# テーブルを見つけるためにTableAbsorberオブジェクトを作成する
absorber = ap.text.TableAbsorber()
# アブソーバーで最初のページを訪問する
absorber.visit(pdf_document.pages[1])
# ページ上の最初のテーブルを取得する
table = absorber.table_list[0]
# テーブルを削除する
absorber.remove(table)
# PDFを保存する
pdf_document.save(output_file)
PDF ドキュメントから複数のテーブルを削除する
時々、PDF ドキュメントには複数のテーブルが含まれていることがあり、それらを削除する必要が出てくることがあります。 複数のテーブルをPDFドキュメントから削除するためには、以下のコードスニペットを使用してください:
import aspose.pdf as ap
# 既存のPDFドキュメントを読み込む
pdf_document = ap.Document(input_file)
# テーブルを見つけるためのTableAbsorberオブジェクトを作成
absorber = ap.text.TableAbsorber()
# アブソーバーで2ページ目を訪問
absorber.visit(pdf_document.pages[1])
# テーブルコレクションのコピーを取得
tables = absorber.table_list
# コレクションのコピーをループし、テーブルを削除
for table in tables:
absorber.remove(table)
# ドキュメントを保存
pdf_document.save(output_file)