在 .NET 中将 PDF 转换为 Excel

概览

本文介绍如何使用 C# 将 PDF 转换为 Excel 格式。它涵盖以下主题。

以下代码片段也适用于 Aspose.PDF.Drawing 库。

格式: XLS

格式: XLSX

格式: Excel

格式: 单个 Excel 工作表

格式: XML Spreadsheet 2003 格式

格式: CSV

格式: ODS

C# PDF 转 Excel 转换

Aspose.PDF for .NET 支持将 PDF 文件转换为 Excel 2007、CSV 和 SpeadsheetML 格式的功能。 Aspose.PDF for .NET 支持将 PDF 文件转换为 Excel 2007、CSV 和 SpeadsheetML 格式的功能。

Aspose.PDF for .NET 是一个 PDF 操作组件,我们引入了一个功能,该功能将 PDF 文件渲染为 Excel 工作簿(XLSX 文件)。在此转换过程中,PDF 文件的各个页面被转换为 Excel 工作表。

为了将 PDF 文件转换为 XLSX 格式,Aspose.PDF 提供了一个名为 ExcelSaveOptions 的类。 为了将 PDF 文件转换为 XLSX 格式,Aspose.PDF 提供了一个名为 ExcelSaveOptions 的类。

以下代码片段显示了使用 Aspose.PDF for .NET 将 PDF 文件转换为 XLS 或 XLSX 格式的过程。

步骤:在 C# 中将 PDF 转换为 XLS

  1. 使用源 PDF 文档创建 Document 对象的实例。
  2. 创建 ExcelSaveOptions 的实例。
  3. 通过调用 Document.Save() 方法并传递 ExcelSaveOptions,将其保存为 XLS 格式并指定 .xls 扩展名

步骤:在 C# 中将 PDF 转换为 XLSX

  1. 使用源 PDF 文档创建 Document 对象的实例。
  2. 创建 ExcelSaveOptions 的实例。
  3. 通过调用 Document.Save() 方法并传递 ExcelSaveOptions,将其保存为 XLSX 格式并指定 .xlsx 扩展名
// 代码示例将在这里给出,确保使用正确的 C# 语法和风格
// 有关完整示例和数据文件,请访问 https://github.com/aspose-pdf/Aspose.PDF-for-.NET
// 文档目录的路径。
string dataDir = RunExamples.GetDataDir_AsposePdf_DocumentConversion();

// 加载 PDF 文档
Document pdfDocument = new Document(dataDir + "input.pdf");

// 实例化 ExcelSave 选项对象
Aspose.Pdf.ExcelSaveOptions excelsave = new ExcelSaveOptions();

// 以 XLS 格式保存输出
pdfDocument.Save("PDFToXLS_out.xlsx", excelsave);

将 PDF 转换为带控制列的 XLS

将 PDF 转换为 XLS 格式时,在输出文件中会添加一个空白列作为第一列。在 ExcelSaveOptions 类的 InsertBlankColumnAtFirst 选项用于控制这一列。默认值为 false,这意味着不会插入空白列。

public static void ConvertPDFtoExcelAdvanced_InsertBlankColumnAtFirst()
{
    // 有关完整示例和数据文件,请访问 https://github.com/aspose-pdf/Aspose.PDF-for-.NET
    // 加载 PDF 文档
    Document pdfDocument = new Document(_dataDir + "input.pdf");
    // 实例化 ExcelSave 选项对象
    Aspose.Pdf.ExcelSaveOptions excelsave = new ExcelSaveOptions {InsertBlankColumnAtFirst = false};
    // 以 XLS 格式保存输出
    pdfDocument.Save("PDFToXLS_out.xlsx", excelsave);
}

将PDF转换为单个Excel工作表

当将一个包含多页的PDF文件导出到XLS时,每一页将被导出到Excel文件中的不同工作表。这是因为默认情况下MinimizeTheNumberOfWorksheets属性设置为false。为了确保所有页面都导出到输出Excel文件的一个单独工作表中,请将MinimizeTheNumberOfWorksheets属性设置为true。

步骤:在C#中将PDF转换为XLS或XLSX单个工作表

  1. 使用源PDF文档创建Document对象的实例。
  2. 创建ExcelSaveOptions的实例,其中MinimizeTheNumberOfWorksheets = true
  3. 通过调用Document.Save()方法并传递ExcelSaveOptions,将其保存为具有单个工作表的XLSXLSX格式。
public static void ConvertPDFtoExcelAdvanced_MinimizeTheNumberOfWorksheets()
{
    // 完整示例和数据文件,请访问 https://github.com/aspose-pdf/Aspose.PDF-for-.NET
    // 加载PDF文档
    Document pdfDocument = new Document(_dataDir + "input.pdf");

    // 实例化ExcelSave选项对象
    Aspose.Pdf.ExcelSaveOptions excelsave = new ExcelSaveOptions {MinimizeTheNumberOfWorksheets = true};
    // 保存输出为XLS格式
    pdfDocument.Save("PDFToXLS_out.xlsx", excelsave);
}

转换为其他电子表格格式

转换为 XML 电子表格 2003 格式

自 20.8 版本起,Aspose.PDF 使用 Microsoft Excel Open XML Spreadsheet 2007 文件格式作为默认存储数据的格式。为了将 PDF 文件转换为 XML Spreadsheet 2003 格式,Aspose.PDF 提供了一个名为 ExcelSaveOptions 的类,该类中有一个 Format 属性。一个 ExcelSaveOptions 类的对象作为第二个参数传递给 Document.Save(..) 方法。

以下代码片段展示了将 PDF 文件转换为 XLS Excel 2003 XML 格式的过程。

步骤:在 C# 中将 PDF 转换为 Excel 2003 XML 格式

  1. 使用源 PDF 文档创建 Document 对象的实例。
  2. 通过调用 Document.Save() 方法并传递 ExcelSaveOptions,将其保存为 XLS - Excel 2003 XML格式
public static void ConvertPDFtoExcelAdvanced_SaveXLS2003()
{
    // 有关完整示例和数据文件,请访问 https://github.com/aspose-pdf/Aspose.PDF-for-.NET

    // 加载PDF文档
    Document pdfDocument = new Document(_dataDir + "input.pdf");

    // 实例化ExcelSave Option对象
    ExcelSaveOptions excelSave = new ExcelSaveOptions { Format = ExcelSaveOptions.ExcelFormat.XMLSpreadSheet2003 };

    // 保存输出为XLS格式
    pdfDocument.Save("PDFToXLS_out.xls", excelSave);
}

转换为CSV

转换为CSV格式的操作与上述相同。您需要做的就是设置适当的格式。

步骤:在C#中将PDF转换为CSV

  1. 使用源PDF文档创建 Document 对象的实例。
  2. 通过调用 Document.Save() 方法并传递 ExcelSaveOptions,将其保存为CSV格式。
 // 实例化 ExcelSave Option 对象
    ExcelSaveOptions excelSave = new ExcelSaveOptions { Format = ExcelSaveOptions.ExcelFormat.CSV };

转换为 ODS

步骤:在 C# 中将 PDF 转换为 ODS

  1. 使用源 PDF 文档创建 Document 对象的实例。
  2. 创建 ExcelSaveOptions 的实例,设置 Format = ExcelSaveOptions.ExcelFormat.ODS
  3. 通过调用 Document.Save() 方法并传递 ExcelSaveOptions,将其保存为 ODS 格式。

转换为 ODS 格式的操作与其他格式相同。

 // 实例化 ExcelSave Option 对象
    ExcelSaveOptions excelSave = new ExcelSaveOptions { Format = ExcelSaveOptions.ExcelFormat.ODS };

另见

本文还涵盖了以下主题。代码与上述相同。

格式Excel

格式: XLS

格式: XLSX

格式: CSV

格式: ODS