PDFをExcelに変換

Aspose.PDF for Java APIを使用すると、PDFファイルをExcel XLS および XLSX ファイル形式にレンダリングできます。既存のExcelワークブックを作成および操作する機能を提供する別のAPI、Aspose.Cells for Javaもあります。また、ExcelワークブックをPDF形式に変換する機能も提供します。

PDFをExcel XLSに変換する

PDFファイルをXLS形式に変換するには、Aspose.PDFにはExcelSaveOptionsというクラスがあります。ExcelSaveOptionsクラスのオブジェクトをDocument.Save(..)メソッドの第二引数として渡します。

PDFファイルをXLSX形式に変換することは、Aspose.PDF for Java 18.6バージョンのライブラリの一部です。PDFファイルをXLSX形式に変換するためには、ExcelSaveOptionsクラスのsetFormat()メソッドを使用して形式をXLSXに設定する必要があります。

以下のコードスニペットは、PDFファイルをxlsおよび.xlsx形式に変換する方法を示しています。

package com.aspose.pdf.examples;

import java.io.IOException;
import java.nio.file.Path;
import java.nio.file.Paths;

import com.aspose.pdf.*;

public final class ConvertPDFtoXLSX {

    private ConvertPDFtoXLSX() {

    }

    // ドキュメントディレクトリへのパス。
    private static Path _dataDir = Paths.get("/home/admin1/pdf-examples/Samples");

    public static void main(String[] args) throws IOException {

        ConvertPDFtoExcelSimple();
        ConvertPDFtoExcelAdvanced_InsertBlankColumnAtFirst();
        ConvertPDFtoExcelAdvanced_MinimizeTheNumberOfWorksheets();
        ConvertPDFtoExcelAdvanced_SaveXLSX();
    }

    public static void ConvertPDFtoExcelSimple() {
        // PDFドキュメントを読み込む
        Document pdfDocument = new Document(_dataDir + "input.pdf");

        // ExcelSave Optionオブジェクトをインスタンス化する
        ExcelSaveOptions excelsave = new ExcelSaveOptions();

        // 出力をXLS形式で保存する
        pdfDocument.save("PDFToXLS_out.xls", excelsave);
    }
}

PDFを制御列でXLSに変換する

PDFをXLS形式に変換すると、最初の列として空白の列が出力ファイルに追加されます。この列を制御するために、ExcelSaveOptionsクラスのInsertBlankColumnAtFirstオプションが使用されます。そのデフォルト値はtrueです。

    public static void ConvertPDFtoExcelAdvanced_InsertBlankColumnAtFirst() {
        // PDFドキュメントを読み込む
        Document pdfDocument = new Document(_dataDir + "input.pdf");
        // Excel保存オプションオブジェクトをインスタンス化
        ExcelSaveOptions excelsave = new ExcelSaveOptions();
        excelsave.setInsertBlankColumnAtFirst(false);
        // 出力をXLS形式で保存
        pdfDocument.save("PDFToXLS_out.xls", excelsave);
    }

PDFを単一のExcelワークシートに変換

ページ数が多いPDFファイルをXLSにエクスポートする場合、各ページがExcelファイルの異なるシートにエクスポートされます。 これは、MinimizeTheNumberOfWorksheets プロパティがデフォルトで false に設定されているためです。出力される Excel ファイルですべてのページを1つのシートにエクスポートするには、MinimizeTheNumberOfWorksheets プロパティを true に設定します。

    public static void ConvertPDFtoExcelAdvanced_MinimizeTheNumberOfWorksheets() {
        // PDFドキュメントを読み込む
        Document pdfDocument = new Document(_dataDir + "input.pdf");

        // Excel保存オプションオブジェクトをインスタンス化
        ExcelSaveOptions excelsave = new ExcelSaveOptions();
        excelsave.setMinimizeTheNumberOfWorksheets(true);

        // 出力をXLS形式で保存
        pdfDocument.save("PDFToXLS_out.xls", excelsave);
    }

XLSX形式に変換

デフォルトでは、Aspose.PDF はデータを保存するために XML スプレッドシート 2003 を使用します。 PDFファイルをXLSX形式に変換するために、Aspose.PDFにはFormatを持つExcelSaveOptionsというクラスがあります。ExcelSaveOptionsクラスのオブジェクトは、Document.Save(..)メソッドの第2引数として渡されます。

    public static void ConvertPDFtoExcelAdvanced_SaveXLSX() {
        // PDFドキュメントをロード
        Document pdfDocument = new Document(_dataDir + "input.pdf");

        // ExcelSaveオプションオブジェクトをインスタンス化
        ExcelSaveOptions excelSave = new ExcelSaveOptions();
        excelSave.setFormat(ExcelSaveOptions.ExcelFormat.XLSX);

        // 出力をXLS形式で保存
        pdfDocument.save("PDFToXLS_out.xlsx", excelSave);
    }