Excluir Imagens de Arquivo PDF usando Python

Existem muitas razões para remover todas ou imagens específicas de PDFs.

Às vezes, um arquivo PDF pode conter imagens importantes que precisam ser removidas para proteger a privacidade ou impedir o acesso não autorizado a certas informações.

Remover imagens indesejadas ou redundantes pode ajudar a reduzir o tamanho do arquivo, facilitando o compartilhamento ou armazenamento dos PDFs.

Se necessário, você pode reduzir o número de páginas removendo todas as imagens do documento. Além disso, excluir imagens do documento ajudará a preparar o PDF para compressão ou extração de informações de texto.

Aspose.PDF for Python via .NET irá ajudá-lo com esta tarefa.

Excluir Imagens de Arquivo PDF

Para excluir uma imagem de um arquivo PDF:

  1. Abra o Documento PDF existente.
  2. Exclua uma imagem específica.
  3. Salve o arquivo PDF atualizado.

O trecho de código a seguir mostra como excluir uma imagem de um arquivo PDF.


    import aspose.pdf as ap

    # Abra o documento
    document = ap.Document(input_file)

    # Exclua uma imagem específica
    document.pages[2].resources.images.delete(1)

    # Salve o arquivo PDF atualizado
    document.save(output_pdf)

Excluir todas as imagens do PDF de entrada


    import aspose.pdf as ap

    # Abrir documento
    document = ap.Document(input_file)

    # Excluir todas as imagens em todas as páginas
    for i in range(len(document.pages)):
        while len(document.pages[i + 1].resources.images) != 0:
            document.pages[i + 1].resources.images.delete(1)

    # Salvar arquivo PDF atualizado
    document.save(output_file)