PDFをExcelに変換
Aspose.PDF for Java APIを使用すると、PDFファイルをExcel XLS および XLSX ファイル形式にレンダリングできます。既存のExcelワークブックを作成および操作する機能を提供する別のAPI、Aspose.Cells for Javaもあります。また、ExcelワークブックをPDF形式に変換する機能も提供します。
PDFをExcelにオンラインで変換してみてください
Aspose.PDF for Java は、オンラインで無料のアプリケーション “PDF to XLSX” を提供しており、機能性と品質を調査することができます。
PDFをExcel XLSに変換する
PDFファイルをXLS形式に変換するには、Aspose.PDFにはExcelSaveOptionsというクラスがあります。ExcelSaveOptionsクラスのオブジェクトをDocument.Save(..)メソッドの第二引数として渡します。
PDFファイルをXLSX形式に変換することは、Aspose.PDF for Java 18.6バージョンのライブラリの一部です。PDFファイルをXLSX形式に変換するためには、ExcelSaveOptionsクラスのsetFormat()メソッドを使用して形式をXLSXに設定する必要があります。
以下のコードスニペットは、PDFファイルをxlsおよび.xlsx形式に変換する方法を示しています。
package com.aspose.pdf.examples;
import java.io.IOException;
import java.nio.file.Path;
import java.nio.file.Paths;
import com.aspose.pdf.*;
public final class ConvertPDFtoXLSX {
private ConvertPDFtoXLSX() {
}
// ドキュメントディレクトリへのパス。
private static Path _dataDir = Paths.get("/home/admin1/pdf-examples/Samples");
public static void main(String[] args) throws IOException {
ConvertPDFtoExcelSimple();
ConvertPDFtoExcelAdvanced_InsertBlankColumnAtFirst();
ConvertPDFtoExcelAdvanced_MinimizeTheNumberOfWorksheets();
ConvertPDFtoExcelAdvanced_SaveXLSX();
}
public static void ConvertPDFtoExcelSimple() {
// PDFドキュメントを読み込む
Document pdfDocument = new Document(_dataDir + "input.pdf");
// ExcelSave Optionオブジェクトをインスタンス化する
ExcelSaveOptions excelsave = new ExcelSaveOptions();
// 出力をXLS形式で保存する
pdfDocument.save("PDFToXLS_out.xls", excelsave);
}
}
PDFを制御列でXLSに変換する
PDFをXLS形式に変換すると、最初の列として空白の列が出力ファイルに追加されます。この列を制御するために、ExcelSaveOptionsクラスのInsertBlankColumnAtFirstオプションが使用されます。そのデフォルト値はtrueです。
public static void ConvertPDFtoExcelAdvanced_InsertBlankColumnAtFirst() {
// PDFドキュメントを読み込む
Document pdfDocument = new Document(_dataDir + "input.pdf");
// Excel保存オプションオブジェクトをインスタンス化
ExcelSaveOptions excelsave = new ExcelSaveOptions();
excelsave.setInsertBlankColumnAtFirst(false);
// 出力をXLS形式で保存
pdfDocument.save("PDFToXLS_out.xls", excelsave);
}
PDFを単一のExcelワークシートに変換
ページ数が多いPDFファイルをXLSにエクスポートする場合、各ページがExcelファイルの異なるシートにエクスポートされます。 これは、MinimizeTheNumberOfWorksheets プロパティがデフォルトで false に設定されているためです。出力される Excel ファイルですべてのページを1つのシートにエクスポートするには、MinimizeTheNumberOfWorksheets プロパティを true に設定します。
public static void ConvertPDFtoExcelAdvanced_MinimizeTheNumberOfWorksheets() {
// PDFドキュメントを読み込む
Document pdfDocument = new Document(_dataDir + "input.pdf");
// Excel保存オプションオブジェクトをインスタンス化
ExcelSaveOptions excelsave = new ExcelSaveOptions();
excelsave.setMinimizeTheNumberOfWorksheets(true);
// 出力をXLS形式で保存
pdfDocument.save("PDFToXLS_out.xls", excelsave);
}
XLSX形式に変換
デフォルトでは、Aspose.PDF はデータを保存するために XML スプレッドシート 2003 を使用します。 PDFファイルをXLSX形式に変換するために、Aspose.PDFにはFormatを持つExcelSaveOptionsというクラスがあります。ExcelSaveOptionsクラスのオブジェクトは、Document.Save(..)メソッドの第2引数として渡されます。
public static void ConvertPDFtoExcelAdvanced_SaveXLSX() {
// PDFドキュメントをロード
Document pdfDocument = new Document(_dataDir + "input.pdf");
// ExcelSaveオプションオブジェクトをインスタンス化
ExcelSaveOptions excelSave = new ExcelSaveOptions();
excelSave.setFormat(ExcelSaveOptions.ExcelFormat.XLSX);
// 出力をXLS形式で保存
pdfDocument.save("PDFToXLS_out.xlsx", excelSave);
}