PythonでプログラムによるPDFページのトリミング

ページプロパティを取得する

PDFファイルの各ページには、幅、高さ、塗り足し、裁ち落とし、トリムボックスなどの多くのプロパティがあります。Aspose.PDF for Pythonを使用すると、これらのプロパティにアクセスできます。

  • media_box: メディアボックスは、最大のページボックスです。これは、PostScriptやPDFに印刷されたときに選択されたページサイズ(例えばA4、A5、USレターなど)に対応します。言い換えれば、メディアボックスはPDFドキュメントが表示または印刷されるメディアの物理的サイズを決定します。
  • bleed_box: ドキュメントに塗り足しがある場合、PDFには塗り足しボックスも含まれます。塗り足しは、ページの端を超えて広がる色(またはアートワーク)の量です。これは、ドキュメントが印刷されてサイズに合わせて裁断される(「トリム」される)ときに、インクがページの端まで完全に達するようにするために使用されます。ページが誤って裁断されて - トリムマークからわずかにずれて切られた場合でも - ページに白い端が現れることはありません。
  • trim_box: トリムボックスは、印刷とトリミングの後のドキュメントの最終サイズを示します。
  • art_box: アートボックスは、ドキュメント内のページの実際の内容の周りに描かれたボックスです。 このページボックスは、他のアプリケーションでPDFドキュメントをインポートする際に使用されます。
  • crop_box: crop boxは、Adobe AcrobatでPDFドキュメントが表示される「ページ」のサイズです。通常のビューでは、Adobe Acrobatにcrop boxの内容のみが表示されます。これらのプロパティの詳細な説明については、Adobe.Pdfの仕様、特に10.10.1ページ境界を参照してください。

以下のスニペットは、ページをクロップする方法を示しています:


    import aspose.pdf as ap

    document = ap.Document(input_pdf)

    # 新しいボックス矩形を作成
    new_box = ap.Rectangle(200, 220, 2170, 1520, True)
    document.pages[1].crop_box = new_box
    document.pages[1].trim_box = new_box
    document.pages[1].art_box = new_box
    document.pages[1].bleed_box = new_box

    document.save(output_pdf)

この例では、サンプルファイルをこちらで使用しました。最初は、図1に示されているようにページが表示されます。 Figure 1. Cropped Page

変更後、ページは図2のように表示されます。 Figure 2. Cropped Page