Convertir des documents PDF en Microsoft Word en C++

Vue d’ensemble

Cet article explique comment convertir des documents PDF en Microsoft Word en utilisant C++. Il couvre les sujets suivants.

Format: DOC

Format: DOCX

Format: Format Microsoft Word DOC

Format: Microsoft Word DOCX format

Autres sujets couverts par cet article

Conversions de PDF en Word en C++

L’une des fonctionnalités les plus populaires est la conversion de PDF en DOC Microsoft Word, ce qui facilite la manipulation du contenu. Aspose.PDF pour C++ vous permet de convertir des fichiers PDF en DOC.

Convertir un fichier PDF en DOC (Word 97-2003)

Convertissez un fichier PDF au format DOC avec facilité et contrôle total. Aspose.PDF pour C++ est flexible et prend en charge une grande variété de conversions. La conversion de pages de documents PDF en images, par exemple, est une fonctionnalité très populaire.

Une conversion que beaucoup de nos clients ont demandée est la conversion de PDF en DOC : convertir un fichier PDF en document Microsoft Word. Les clients veulent cela parce que les fichiers PDF ne peuvent pas être facilement modifiés, alors que les documents Word le peuvent. Certaines entreprises souhaitent que leurs utilisateurs puissent manipuler le texte, les tableaux et les images dans des fichiers qui ont commencé comme des PDF.

En gardant vivante la tradition de rendre les choses simples et compréhensibles, Aspose.PDF pour C++ vous permet de transformer un fichier PDF source en un fichier DOC avec deux lignes de code. Pour accomplir cette fonctionnalité, nous avons introduit une énumération nommée SaveFormat et sa valeur .Doc vous permet d’enregistrer le fichier source au format Microsoft Word.

Le code C++ suivant montre le processus de conversion d’un fichier PDF en format DOC.

Étapes : Convertir un PDF en DOC en C++ | Étapes : Convertir un PDF en format Microsoft Word DOC en C++

  1. Créez une instance de l’objet Document avec le document PDF source.
  2. Sauvegardez-le au format SaveFormat::Doc en appelant la méthode Document->Save().
void ConvertPDFtoWord()
{
    std::clog << __func__ << ": Start" << std::endl;
    // Chaîne pour le nom du chemin
    String _dataDir("C:\\Samples\\Conversion\\");

    // Chaîne pour le nom du fichier
    String infilename("sample.pdf");
    String outfilename("PDFToDOC.doc");

    // Ouvrir le document
    auto document = MakeObject<Document>(_dataDir + infilename);

    try {
        // Enregistrer le fichier au format document MS
        document->Save(_dataDir + outfilename, SaveFormat::Doc);
    }
    catch (Exception ex) {
        std::cerr << ex->get_Message();
    }

    std::clog << __func__ << ": Finish" << std::endl;
}

Le code suivant montre le processus de conversion d’un fichier PDF en version DOC Avancée :

void ConvertPDFtoWordDocAdvanced()
{
    std::clog << __func__ << ": Start" << std::endl;
    // Chaîne pour le nom du chemin
    String _dataDir("C:\\Samples\\Conversion\\");

    // Chaîne pour le nom du fichier
    String infilename("sample.pdf");
    String outfilename("PDFToDOC.doc");

    // Ouvrir le document
    auto document = MakeObject<Document>(_dataDir + infilename);

    auto saveOptions = MakeObject<DocSaveOptions>();
    saveOptions->set_Format(DocSaveOptions::DocFormat::Doc);
    // Définir le mode de reconnaissance comme Flow
    saveOptions->set_Mode(DocSaveOptions::RecognitionMode::Flow);
    // Définir la proximité horizontale à 2.5
    saveOptions->set_RelativeHorizontalProximity(2.5f);
    // Activer la valeur pour reconnaître les puces pendant le processus de conversion
    saveOptions->set_RecognizeBullets(true);

    try {
        // Enregistrer le fichier au format document MS
        document->Save(_dataDir + outfilename, saveOptions);
    }
    catch (Exception ex) {
        std::cerr << ex->get_Message();
    }

    std::clog << __func__ << ": Finish" << std::endl;
}

Convertir PDF en DOCX

Aspose.PDF pour C++ API vous permet de lire et de convertir des documents PDF en DOCX en utilisant le langage C++. DOCX est un format bien connu pour les documents Microsoft Word dont la structure a été changée d’un binaire simple à une combinaison de fichiers XML et binaires. Les fichiers Docx peuvent être ouverts avec Word 2007 et les versions ultérieures, mais pas avec les versions antérieures de MS Word qui prennent en charge les extensions de fichiers DOC.

Le code C++ suivant montre le processus de conversion d’un fichier PDF en format DOCX.

Étapes : Convertir PDF en DOCX en C++ | Étapes : Convertir PDF en format Microsoft Word DOCX en C++

  1. Créez une instance de l’objet Document avec le document PDF source.
  2. Enregistrez-le au format SaveFormat::DocX en appelant la méthode Document->Save().
void ConvertPDFtoWord_DOCX_Format()
{
    std::clog << __func__ << ": Start" << std::endl;
    // Chaîne pour le nom du chemin
    String _dataDir("C:\\Samples\\Conversion\\");

    // Chaîne pour le nom du fichier
    String infilename("sample.pdf");
    String outfilename("PDFToDOC.docx");

    // Ouvrir le document
    auto document = MakeObject<Document>(_dataDir + infilename);

    try {
        // Enregistrer le fichier au format document MS
        document->Save(_dataDir + outfilename, SaveFormat::DocX);
    }
    catch (Exception ex) {
        std::cerr << ex->get_Message();
    }

    std::clog << __func__ << ": Finish" << std::endl;
}

La classe DocSaveOptions a une propriété nommée Format qui offre la possibilité de spécifier le format du document résultant, c’est-à-dire, DOC ou DOCX. Afin de convertir un fichier PDF au format DOCX, veuillez passer la valeur Docx de l’énumération DocSaveOptions.DocFormat.

Veuillez consulter l’extrait de code suivant qui offre la possibilité de convertir un fichier PDF au format DOCX avec C++.

void ConvertPDFtoWord_Advanced_DOCX_Format()
{
    std::clog << __func__ << ": Start" << std::endl;
    // Chaîne pour le chemin d'accès
    String _dataDir("C:\\Samples\\Conversion\\");

    // Chaîne pour le nom de fichier
    String infilename("sample.pdf");
    String outfilename("PDFToDOC.docx");

    // Ouvrir le document
    auto document = MakeObject<Document>(_dataDir + infilename);

    auto saveOptions = MakeObject<DocSaveOptions>();
    saveOptions->set_Format(DocSaveOptions::DocFormat::DocX);

    // Définir d'autres paramètres DocSaveOptions
    // ...

    // Enregistrer le fichier au format MS document

    try {
        // Enregistrer le fichier au format MS document
        document->Save(_dataDir + outfilename, saveOptions);
    }
    catch (Exception ex) {
        std::cerr << ex->get_Message();
    }

    std::clog << __func__ << ": Finish" << std::endl;
}

Voir Aussi

Cet article couvre également ces sujets. Les codes sont les mêmes que ci-dessus.

Format: Format Microsoft Word DOC

Format: Format Microsoft Word DOCX

Format: DOC

Format: DOC