Mengonversi PDF ke Excel di .NET

Overview

Artikel ini menjelaskan cara mengonversi PDF ke format Excel menggunakan C#. Ini mencakup topik-topik berikut.

Potongan kode berikut juga bekerja dengan perpustakaan Aspose.PDF.Drawing.

Format: XLS

Format: XLSX

Format: Excel

Format: Single Excel Worksheet

Format: XML Spreadsheet 2003 format

Format: CSV

Format: ODS

C# Konversi PDF ke Excel

Aspose.PDF for .NET mendukung fitur mengonversi berkas PDF ke format Excel 2007, CSV, dan SpeadsheetML. Aspose.PDF untuk .NET mendukung fitur mengonversi file PDF ke format Excel 2007, CSV, dan SpeadsheetML.

Aspose.PDF untuk .NET adalah komponen manipulasi PDF, kami telah memperkenalkan fitur yang mengonversi file PDF ke buku kerja Excel (file XLSX). Selama konversi ini, halaman-halaman individu dari file PDF diubah menjadi lembar kerja Excel.

Untuk mengonversi file PDF ke format XLSX, Aspose.PDF memiliki kelas yang disebut ExcelSaveOptions. Untuk mengonversi file PDF ke format XLSX, Aspose.PDF memiliki kelas yang disebut ExcelSaveOptions.

Potongan kode berikut menunjukkan proses konversi file PDF menjadi format XLS atau XLSX dengan Aspose.PDF untuk .NET.

Langkah: Mengonversi PDF ke XLS di C#

  1. Buat sebuah instansi dari objek Document dengan dokumen PDF sumber.
  2. Buat sebuah instansi dari ExcelSaveOptions.
  3. Simpan dalam format XLS dengan menentukan ekstensi .xls dengan memanggil metode Document.Save() dan memberikannya ExcelSaveOptions

Langkah: Mengonversi PDF ke XLSX di C#

  1. Buat sebuah instansi dari objek Document dengan dokumen PDF sumber.
  2. Buat sebuah instansi dari ExcelSaveOptions.
  3. Simpan dalam format XLSX dengan menentukan ekstensi .xlsx dengan memanggil metode Document.Save() dan memberikannya ExcelSaveOptions

Konversi PDF ke XLS dengan Kontrol Kolom

Saat mengonversi PDF ke format XLS, kolom kosong ditambahkan ke file output sebagai kolom pertama. Opsi InsertBlankColumnAtFirst di kelas ExcelSaveOptions digunakan untuk mengontrol kolom ini. Nilai default adalah false, yang berarti kolom kosong tidak akan dimasukkan.

public static void ConvertPDFtoExcelAdvanced_InsertBlankColumnAtFirst()
{
    // Untuk contoh lengkap dan file data, silakan kunjungi https://github.com/aspose-pdf/Aspose.PDF-for-.NET
    // Muat dokumen PDF
    Document pdfDocument = new Document(_dataDir + "input.pdf");
    // Instansiasi objek Opsi Simpan Excel
    Aspose.Pdf.ExcelSaveOptions excelsave = new ExcelSaveOptions {InsertBlankColumnAtFirst = false};
    // Simpan output dalam format XLS
    pdfDocument.Save("PDFToXLS_out.xlsx", excelsave);
}

Mengonversi PDF ke Satu Lembar Kerja Excel

Ketika mengekspor file PDF dengan banyak halaman ke XLS, setiap halaman diekspor ke lembar yang berbeda dalam file Excel. Hal ini karena properti MinimizeTheNumberOfWorksheets diatur ke false secara default. Untuk memastikan bahwa semua halaman diekspor ke satu lembar tunggal dalam file Excel keluaran, atur properti MinimizeTheNumberOfWorksheets ke true.

Langkah: Mengonversi PDF ke XLS atau XLSX Satu Lembar Kerja dalam C#

  1. Buat sebuah instansi dari objek Document dengan dokumen PDF sumber.
  2. Buat sebuah instansi dari ExcelSaveOptions dengan MinimizeTheNumberOfWorksheets = true.
  3. Simpan ke format XLS atau XLSX yang memiliki satu lembar kerja dengan memanggil metode Document.Save() dan melewatinya ExcelSaveOptions.
public static void ConvertPDFtoExcelAdvanced_MinimizeTheNumberOfWorksheets()
{
    // Untuk contoh lengkap dan file data, silakan kunjungi https://github.com/aspose-pdf/Aspose.PDF-for-.NET
    // Muat dokumen PDF
    Document pdfDocument = new Document(_dataDir + "input.pdf");

    // Buat instance opsi penyimpanan Excel
    Aspose.Pdf.ExcelSaveOptions excelsave = new ExcelSaveOptions {MinimizeTheNumberOfWorksheets = true};
    // Simpan keluaran dalam format XLS
    pdfDocument.Save("PDFToXLS_out.xlsx", excelsave);
}

Konversi ke format spreadsheet lain

Konversi ke format XML Spreadsheet 2003

Sejak versi 20.8 Aspose.PDF menggunakan format file Microsoft Excel Open XML Spreadsheet 2007 sebagai default untuk menyimpan data. Untuk mengubah file PDF ke format XML Spreadsheet 2003, Aspose.PDF memiliki kelas yang disebut ExcelSaveOptions dengan Format. Sebuah objek dari kelas ExcelSaveOptions ini diberikan sebagai argumen kedua untuk metode Document.Save(..).

Potongan kode berikut menunjukkan proses untuk mengonversi file PDF menjadi format XLS Excel 2003 XML.

Langkah: Konversi PDF ke Format Excel 2003 XML dalam C#

  1. Buat sebuah instansi dari objek Document dengan dokumen PDF sumber.

Simpan dalam format XLS - Excel 2003 XML Format dengan memanggil metode Document.Save() dan memberikan ExcelSaveOptions.

public static void ConvertPDFtoExcelAdvanced_SaveXLS2003()
{
    // Untuk contoh lengkap dan file data, silakan kunjungi https://github.com/aspose-pdf/Aspose.PDF-for-.NET

    // Muat dokumen PDF
    Document pdfDocument = new Document(_dataDir + "input.pdf");

    // Buat objek opsi penyimpanan Excel
    ExcelSaveOptions excelSave = new ExcelSaveOptions { Format = ExcelSaveOptions.ExcelFormat.XMLSpreadSheet2003 };

    // Simpan keluaran dalam format XLS
    pdfDocument.Save("PDFToXLS_out.xls", excelSave);
}

Konversi ke CSV

Konversi ke format CSV dilakukan dengan cara yang sama seperti di atas. Yang Anda perlukan hanyalah mengatur format yang sesuai.

Langkah: Mengonversi PDF ke CSV dalam C#

  1. Buat sebuah instance dari objek Document dengan dokumen PDF sumber.

Simpan dalam format CSV dengan memanggil metode Document.Save() dan memberikan ExcelSaveOptions.

 // Instansiasi objek ExcelSave Option
    ExcelSaveOptions excelSave = new ExcelSaveOptions { Format = ExcelSaveOptions.ExcelFormat.CSV };

Konversi ke ODS

Langkah: Konversi PDF ke ODS di C#

  1. Buat sebuah instansi dari objek Document dengan dokumen PDF sumber.
  2. Buat sebuah instansi dari ExcelSaveOptions dengan Format = ExcelSaveOptions.ExcelFormat.ODS
  3. Simpan dalam format ODS dengan memanggil metode Document.Save() dan memberikan ExcelSaveOptions.

Konversi ke format ODS dilakukan dengan cara yang sama seperti format lain.

 // Instansiasi objek ExcelSave Option
    ExcelSaveOptions excelSave = new ExcelSaveOptions { Format = ExcelSaveOptions.ExcelFormat.ODS };

Lihat Juga

Artikel ini juga mencakup topik-topik berikut. Kode-kodenya sama seperti di atas.

Format: Excel

Format: XLS

Format: XLSX

Format: CSV

Format: ODS