Convert PDF to Microsoft Word Documents in C++

Overview

Artikel ini menjelaskan cara mengonversi PDF ke Dokumen Microsoft Word menggunakan C++. Ini mencakup topik-topik berikut.

Format: DOC

Format: DOCX

Format: Format Microsoft Word DOC

Format: Format Microsoft Word DOCX

Topik lain yang dibahas dalam artikel ini

Konversi PDF ke Word C++

Salah satu fitur paling populer adalah konversi PDF ke Microsoft Word DOC, yang membuat konten mudah untuk dimanipulasi. Aspose.PDF untuk C++ memungkinkan Anda mengonversi file PDF ke DOC.

Mengonversi file PDF ke DOC (Word 97-2003)

Mengonversi file PDF ke format DOC dengan mudah dan kontrol penuh. Aspose.PDF untuk C++ fleksibel dan mendukung berbagai macam konversi. Mengonversi halaman dari dokumen PDF ke gambar, misalnya, adalah fitur yang sangat populer.

Sebuah konversi yang banyak diminta oleh pelanggan kami adalah PDF ke DOC: mengonversi file PDF ke dokumen Microsoft Word. Pelanggan menginginkan ini karena file PDF tidak dapat dengan mudah diedit, sedangkan dokumen Word dapat. Beberapa perusahaan ingin pengguna mereka dapat memanipulasi teks, tabel, dan gambar dalam file yang dimulai sebagai PDF.

Menjaga tradisi membuat sesuatu yang sederhana dan dapat dimengerti, Aspose.PDF untuk C++ memungkinkan Anda mengubah file PDF sumber menjadi file DOC dengan dua baris kode. Untuk mencapai fitur ini, kami telah memperkenalkan enumerasi bernama SaveFormat dan nilainya .Doc memungkinkan Anda menyimpan file sumber ke format Microsoft Word.

Cuplikan kode C++ berikut menunjukkan proses konversi file PDF ke format DOC.

Langkah-langkah: Mengonversi PDF ke DOC di C++ | Langkah-langkah: Mengonversi PDF ke format Microsoft Word DOC di C++

  1. Buat instance objek Document dengan dokumen PDF sumber.

```cpp
void ConvertPDFtoWord()
{
    std::clog << __func__ << ": Mulai" << std::endl;
    // String untuk nama jalur
    String _dataDir("C:\\Samples\\Conversion\\");

    // String untuk nama file
    String infilename("sample.pdf");
    String outfilename("PDFToDOC.doc");

    // Buka dokumen
    auto document = MakeObject<Document>(_dataDir + infilename);

    try {
        // Simpan file ke dalam format dokumen MS
        document->Save(_dataDir + outfilename, SaveFormat::Doc);
    }
    catch (Exception ex) {
        std::cerr << ex->get_Message();
    }

    std::clog << __func__ << ": Selesai" << std::endl;
}

Cuplikan kode berikut menunjukkan proses mengubah file PDF menjadi versi DOC Lanjutan:

void ConvertPDFtoWordDocAdvanced()
{
    std::clog << __func__ << ": Mulai" << std::endl;
    // String untuk nama jalur
    String _dataDir("C:\\Samples\\Conversion\\");

    // String untuk nama file
    String infilename("sample.pdf");
    String outfilename("PDFToDOC.doc");

    // Buka dokumen
    auto document = MakeObject<Document>(_dataDir + infilename);

    auto saveOptions = MakeObject<DocSaveOptions>();
    saveOptions->set_Format(DocSaveOptions::DocFormat::Doc);
    // Atur mode pengenalan sebagai Flow
    saveOptions->set_Mode(DocSaveOptions::RecognitionMode::Flow);
    // Atur kedekatan Horizontal sebagai 2.5
    saveOptions->set_RelativeHorizontalProximity(2.5f);
    // Aktifkan nilai untuk mengenali bullet selama proses konversi
    saveOptions->set_RecognizeBullets(true);

    try {
        // Simpan file ke dalam format dokumen MS
        document->Save(_dataDir + outfilename, saveOptions);
    }
    catch (Exception ex) {
        std::cerr << ex->get_Message();
    }

    std::clog << __func__ << ": Selesai" << std::endl;
}

Konversi PDF ke DOCX

Aspose.PDF untuk API C++ memungkinkan Anda membaca dan mengonversi dokumen PDF ke DOCX menggunakan bahasa C++. DOCX adalah format terkenal untuk dokumen Microsoft Word yang strukturnya diubah dari biner biasa menjadi kombinasi file XML dan biner. File Docx dapat dibuka dengan Word 2007 dan versi lateral tetapi tidak dengan versi MS Word sebelumnya yang mendukung ekstensi file DOC.

Cuplikan kode C++ berikut menunjukkan proses mengonversi file PDF ke format DOCX.

Langkah-langkah: Konversi PDF ke DOCX dalam C++ | Langkah-langkah: Konversi PDF ke format Microsoft Word DOCX dalam C++

  1. Buat instance objek Document dengan dokumen PDF sumber.
  2. Simpan ke format SaveFormat::DocX dengan memanggil metode Document->Save().
void ConvertPDFtoWord_DOCX_Format()
{
    std::clog << __func__ << ": Start" << std::endl;
    // String untuk nama path
    String _dataDir("C:\\Samples\\Conversion\\");

    // String untuk nama file
    String infilename("sample.pdf");
    String outfilename("PDFToDOC.docx");

    // Buka dokumen
    auto document = MakeObject<Document>(_dataDir + infilename);

    try {
        // Simpan file ke dalam format dokumen MS
        document->Save(_dataDir + outfilename, SaveFormat::DocX);
    }
    catch (Exception ex) {
        std::cerr << ex->get_Message();
    }

    std::clog << __func__ << ": Finish" << std::endl;
}

Kelas DocSaveOptions memiliki properti bernama Format yang menyediakan kemampuan untuk menentukan format dokumen hasil, yaitu, DOC atau DOCX. Untuk mengkonversi file PDF ke format DOCX, silakan gunakan nilai Docx dari enumerasi DocSaveOptions.DocFormat.

Silakan lihat potongan kode berikut yang menyediakan kemampuan untuk mengkonversi file PDF ke format DOCX dengan C++.

void ConvertPDFtoWord_Advanced_DOCX_Format()
{
    std::clog << __func__ << ": Mulai" << std::endl;
    // String untuk nama jalur
    String _dataDir("C:\\Samples\\Conversion\\");

    // String untuk nama file
    String infilename("sample.pdf");
    String outfilename("PDFToDOC.docx");

    // Buka dokumen
    auto document = MakeObject<Document>(_dataDir + infilename);

    auto saveOptions = MakeObject<DocSaveOptions>();
    saveOptions->set_Format(DocSaveOptions::DocFormat::DocX);

    // Setel parameter DocSaveOptions lainnya
    // ...

    // Simpan file ke dalam format dokumen MS

    try {
        // Simpan file ke dalam format dokumen MS
        document->Save(_dataDir + outfilename, saveOptions);
    }
    catch (Exception ex) {
        std::cerr << ex->get_Message();
    }

    std::clog << __func__ << ": Selesai" << std::endl;
}

Lihat Juga

Artikel ini juga mencakup topik-topik ini. Kode-kodenya sama seperti di atas.

Format: Format Microsoft Word DOC

Format: Format Microsoft Word DOCX

Format: DOC

Format: DOC