Удалить таблицы из существующего PDF

Чтобы удалить таблицы, нам необходимо использовать класс TableAbsorber, чтобы получить доступ к таблицам в существующем PDF, а затем вызвать метод remove().

Удаление таблицы из PDF-документа

Мы добавили новую функцию, т.е. remove() к существующему классу TableAbsorber для удаления таблицы из PDF-документа. Как только абсорбер успешно находит таблицы на странице, он становится способен их удалять. Пожалуйста, ознакомьтесь с следующим фрагментом кода, показывающим, как удалить таблицу из PDF-документа:


    import aspose.pdf as ap

    # Загрузить существующий PDF документ
    pdf_document = ap.Document(input_file)
    # Создать объект TableAbsorber для поиска таблиц
    absorber = ap.text.TableAbsorber()
    # Посетить первую страницу с абсорбером
    absorber.visit(pdf_document.pages[1])
    # Получить первую таблицу на странице
    table = absorber.table_list[0]
    # Удалить таблицу
    absorber.remove(table)
    # Сохранить PDF
    pdf_document.save(output_file)

Удаление нескольких таблиц из PDF-документа

Иногда PDF-документ может содержать более одной таблицы, и может возникнуть необходимость удалить из него несколько таблиц. Для удаления нескольких таблиц из PDF-документа, используйте следующий фрагмент кода:


    import aspose.pdf as ap

    # Загрузить существующий PDF-документ
    pdf_document = ap.Document(input_file)
    # Создать объект TableAbsorber для поиска таблиц
    absorber = ap.text.TableAbsorber()
    # Посетить вторую страницу с поглотителем
    absorber.visit(pdf_document.pages[1])
    # Получить копию коллекции таблиц
    tables = absorber.table_list
    # Перебирать копию коллекции и удалять таблицы
    for table in tables:
        absorber.remove(table)
    # Сохранить документ
    pdf_document.save(output_file)