Convertir PDF a Documentos de Microsoft Word en C++

Resumen

Este artículo explica cómo convertir PDF a Documentos de Microsoft Word usando C++. Cubre estos temas.

Formato: DOC

Formato: DOCX

Formato: Formato DOC de Microsoft Word

Format: Microsoft Word DOCX formato

Otros temas cubiertos por este artículo

Conversiones de PDF a Word en C++

Una de las características más populares es la conversión de PDF a Microsoft Word DOC, lo que facilita la manipulación del contenido. Aspose.PDF para C++ te permite convertir archivos PDF a DOC.

Convertir archivo PDF a DOC (Word 97-2003)

Convierte archivos PDF a formato DOC con facilidad y control total. Aspose.PDF para C++ es flexible y soporta una amplia variedad de conversiones. Convertir páginas de documentos PDF a imágenes, por ejemplo, es una característica muy popular.

Una conversión que muchos de nuestros clientes han solicitado es de PDF a DOC: convertir un archivo PDF a un documento de Microsoft Word. Los clientes quieren esto porque los archivos PDF no se pueden editar fácilmente, mientras que los documentos de Word sí. Algunas empresas quieren que sus usuarios puedan manipular texto, tablas e imágenes en archivos que comenzaron como PDFs.

Manteniendo viva la tradición de hacer las cosas simples y comprensibles, Aspose.PDF para C++ te permite transformar un archivo PDF fuente en un archivo DOC con dos líneas de código. Para lograr esta función, hemos introducido una enumeración llamada SaveFormat y su valor .Doc te permite guardar el archivo fuente en formato Microsoft Word.

El siguiente fragmento de código C++ muestra el proceso de conversión de un archivo PDF a formato DOC.

Pasos: Convertir PDF a DOC en C++ | Pasos: Convertir PDF a formato DOC de Microsoft Word en C++

  1. Crea una instancia del objeto Document con el documento PDF fuente.
  2. Guárdelo en formato SaveFormat::Doc llamando al método Document->Save().
void ConvertPDFtoWord()
{
    std::clog << __func__ << ": Start" << std::endl;
    // Cadena para nombre de ruta
    String _dataDir("C:\\Samples\\Conversion\\");

    // Cadena para nombre de archivo
    String infilename("sample.pdf");
    String outfilename("PDFToDOC.doc");

    // Abrir documento
    auto document = MakeObject<Document>(_dataDir + infilename);

    try {
        // Guardar el archivo en formato de documento MS
        document->Save(_dataDir + outfilename, SaveFormat::Doc);
    }
    catch (Exception ex) {
        std::cerr << ex->get_Message();
    }

    std::clog << __func__ << ": Finish" << std::endl;
}

El siguiente fragmento de código muestra el proceso de conversión de un archivo PDF a DOC versión avanzada:

void ConvertPDFtoWordDocAdvanced()
{
    std::clog << __func__ << ": Start" << std::endl;
    // Cadena para nombre de ruta
    String _dataDir("C:\\Samples\\Conversion\\");

    // Cadena para nombre de archivo
    String infilename("sample.pdf");
    String outfilename("PDFToDOC.doc");

    // Abrir documento
    auto document = MakeObject<Document>(_dataDir + infilename);

    auto saveOptions = MakeObject<DocSaveOptions>();
    saveOptions->set_Format(DocSaveOptions::DocFormat::Doc);
    // Establecer el modo de reconocimiento como Flujo
    saveOptions->set_Mode(DocSaveOptions::RecognitionMode::Flow);
    // Establecer la proximidad horizontal como 2.5
    saveOptions->set_RelativeHorizontalProximity(2.5f);
    // Habilitar el valor para reconocer viñetas durante el proceso de conversión
    saveOptions->set_RecognizeBullets(true);

    try {
        // Guardar el archivo en formato de documento MS
        document->Save(_dataDir + outfilename, saveOptions);
    }
    catch (Exception ex) {
        std::cerr << ex->get_Message();
    }

    std::clog << __func__ << ": Finish" << std::endl;
}

Convertir PDF a DOCX

La API Aspose.PDF para C++ te permite leer y convertir documentos PDF a DOCX utilizando el lenguaje C++. DOCX es un formato bien conocido para documentos de Microsoft Word cuya estructura cambió de binario simple a una combinación de archivos XML y binarios. Los archivos Docx se pueden abrir con Word 2007 y versiones posteriores, pero no con las versiones anteriores de MS Word que soportan extensiones de archivo DOC.

El siguiente fragmento de código C++ muestra el proceso de conversión de un archivo PDF a formato DOCX.

Pasos: Convertir PDF a DOCX en C++ | Pasos: Convertir PDF a formato Microsoft Word DOCX en C++

  1. Cree una instancia del objeto Document con el documento PDF de origen.
  2. Guárdelo en formato SaveFormat::DocX llamando al método Document->Save().
void ConvertPDFtoWord_DOCX_Format()
{
    std::clog << __func__ << ": Start" << std::endl;
    // Cadena para el nombre del directorio
    String _dataDir("C:\\Samples\\Conversion\\");

    // Cadena para el nombre del archivo
    String infilename("sample.pdf");
    String outfilename("PDFToDOC.docx");

    // Abrir documento
    auto document = MakeObject<Document>(_dataDir + infilename);

    try {
        // Guardar el archivo en formato de documento de MS
        document->Save(_dataDir + outfilename, SaveFormat::DocX);
    }
    catch (Exception ex) {
        std::cerr << ex->get_Message();
    }

    std::clog << __func__ << ": Finish" << std::endl;
}

La clase DocSaveOptions tiene una propiedad llamada Format que proporciona la capacidad de especificar el formato del documento resultante, es decir, DOC o DOCX. En orden de convertir un archivo PDF a formato DOCX, por favor pase el valor Docx desde la enumeración DocSaveOptions.DocFormat.

Por favor, eche un vistazo al siguiente fragmento de código que proporciona la capacidad de convertir un archivo PDF a formato DOCX con C++.

void ConvertPDFtoWord_Advanced_DOCX_Format()
{
    std::clog << __func__ << ": Start" << std::endl;
    // String para nombre de ruta
    String _dataDir("C:\\Samples\\Conversion\\");

    // String para nombre de archivo
    String infilename("sample.pdf");
    String outfilename("PDFToDOC.docx");

    // Abrir documento
    auto document = MakeObject<Document>(_dataDir + infilename);

    auto saveOptions = MakeObject<DocSaveOptions>();
    saveOptions->set_Format(DocSaveOptions::DocFormat::DocX);

    // Establecer otros parámetros de DocSaveOptions
    // ...

    // Guardar el archivo en formato de documento MS

    try {
        // Guardar el archivo en formato de documento MS
        document->Save(_dataDir + outfilename, saveOptions);
    }
    catch (Exception ex) {
        std::cerr << ex->get_Message();
    }

    std::clog << __func__ << ": Finish" << std::endl;
}

Ver También

Este artículo también cubre estos temas. Los códigos son los mismos que arriba.

Formato: Formato Microsoft Word DOC

Formato: Formato Microsoft Word DOCX

Formato: DOC

Formato: DOC