DOC Converter
Artikel ini akan memandu Anda menggunakan Aspose.Pdf DOC Converter untuk .NET untuk mengonversi dokumen PDF menjadi format Microsoft Word (.doc / .docx).
Prasyarat
Anda akan membutuhkan hal-hal berikut:
- Visual Studio 2019 atau lebih baru
- Aspose.PDF untuk .NET 24.1 atau lebih baru
- Sebuah file PDF contoh yang mengandung beberapa bidang formulir
Anda dapat mengunduh pustaka Aspose.PDF untuk .NET dari situs web resmi atau menginstalnya menggunakan NuGet Package Manager di Visual Studio.
Langkah-langkah
1. Menyiapkan Konversi Anda (tangkapan layar dari kelas FileDataSource)
Proses konversi melibatkan tiga langkah utama: mendefinisikan file masukan dan keluaran, membuat objek PdfDoc
, dan menentukan opsi konversi.
1.1. Mendefinisikan Sumber Data
- File Masukan: Kami akan menggunakan kelas
FileDataSource
untuk menentukan lokasi file PDF yang ingin Anda konversi. - Berkas Masukan: Kita akan menggunakan kelas
FileDataSource
untuk menentukan lokasi berkas PDF yang ingin Anda konversi.
FileDataSource inputDataSource = new(Path.Combine(@"C:\Samples\", "sample.pdf"));
-
Ganti
"C:\Samples\sample.pdf"
dengan jalur sebenarnya ke berkas PDF Anda. -
Berkas Keluaran: Sama seperti itu, gunakan objek
FileDataSource
lain untuk menentukan lokasi dan nama berkas untuk dokumen Word hasil konversi.
FileDataSource outputDataSource = new(Path.Combine(@"C:\Samples\", "sample.docx"));
- Ganti
"C:\Samples\sample.docx"
dengan jalur keluaran dan nama berkas yang Anda inginkan.
2. Membuat Objek Plugin PdfDoc (tangkapan layar kelas PdfDoc)
Selanjutnya, kita membuat sebuah instansi dari kelas PdfDoc
untuk melakukan konversi.
var plugin = new PdfDoc();
Objek ini berfungsi sebagai mesin untuk proses konversi.
3. Mengkonfigurasi Opsi Konversi
Kelas PdfToDocOptions
memungkinkan Anda untuk menyempurnakan proses konversi.
Kelas PdfToDocOptions
memungkinkan Anda untuk menyesuaikan proses konversi.
-
Save Format: Tentukan format keluaran yang diinginkan untuk dokumen Word. Dalam hal ini, kita menggunakan
SaveFormat.DocX
untuk menghasilkan dokumen yang kompatibel dengan Microsoft Word 2007 atau lebih baru (.docx). -
Conversion Mode: Tentukan bagaimana plugin menginterpretasikan struktur PDF selama konversi. Kita akan menggunakan
ConversionMode.EnhancedFlow
untuk mengoptimalkan dokumen Word yang dihasilkan dalam hal tata letak dan pemformatan.
Berikut adalah potongan kode untuk mengonfigurasi opsi:
PdfToDocOptions options = new()
{
SaveFormat = SaveFormat.DocX,
ConversionMode = ConversionMode.EnhancedFlow
};
Menambahkan Input dan Output:
Terakhir, kita mengaitkan sumber data yang telah didefinisikan sebelumnya dengan opsi konversi menggunakan metode AddInput
dan AddOutput
:
options.AddInput(inputDataSource);
options.AddOutput(outputDataSource);
Ini menghubungkan PDF input dan dokumen Word keluaran yang diinginkan ke proses konversi.
4.
4.
Dengan semuanya sudah diatur, mari kita mulai konversi dengan memanggil metode Process
dari plugin PdfDoc
dan mengoper parameter yang telah dikonfigurasi:
var resultContainer = plugin.Process(options);
Metode ini melakukan konversi dan mengembalikan objek ResultContainer
yang berisi detail tentang proses tersebut.
Mengambil Hasil:
Meskipun tidak esensial untuk konversi dasar, Anda dapat mengakses hasil melalui properti ResultCollection
dari objek ResultContainer
. Ini mungkin berguna untuk debugging atau melacak detail konversi tertentu.
var result = resultContainer.ResultCollection[0];
// Cetak hasil (opsional untuk tujuan demonstrasi)
Console.WriteLine(result);
Dengan langkah terakhir ini, dokumen PDF Anda akan dikonversi ke format Word yang ditentukan dan disimpan ke lokasi output yang telah ditentukan.