PDFをEPUB、LaTeX、Text、XPSに変換するPython

PDFをEPUBに変換

**EPUB**は、国際デジタル出版フォーラム(IDPF)による無料でオープンな電子書籍標準です。 ファイルには拡張子.epubがあります。
EPUBはリフロー可能なコンテンツ向けに設計されており、EPUBリーダーは特定の表示デバイスに最適化されたテキストを表示することができます。また、EPUBは固定レイアウトのコンテンツもサポートしています。このフォーマットは、出版社や変換ハウスが社内で使用したり、配布や販売のために使用できる単一のフォーマットとして意図されています。Open eBook標準に代わるものです。

Aspose.PDF for Pythonは、PDFドキュメントをEPUB形式に変換する機能もサポートしています。Aspose.PDF for Pythonには「EpubSaveOptions」というクラスがあり、save()メソッドの第2引数として使用して、EPUBファイルを生成することができます。Pythonを使用してこの要件を達成するには、次のコードスニペットを試してください。


    import aspose.pdf as ap

    input_pdf = DIR_INPUT + "sample.pdf"
    output_pdf = DIR_OUTPUT + "convert_pdf_to_epub.epub"
    # PDFドキュメントを開く
    document = ap.Document(input_pdf)

    # Epub Saveオプションをインスタンス化
    save_options = ap.EpubSaveOptions()

    # コンテンツのレイアウトを指定
    save_options.content_recognition_mode = ap.EpubSaveOptions.RecognitionMode.FLOW

    # ePUBドキュメントを保存
    document.save(output_pdf, save_options)

PDFをLaTeX/TeXに変換する

Aspose.PDF for Python via .NETは、PDFをLaTeX/TeXに変換することをサポートしています。LaTeXファイル形式は、特殊なマークアップを持つテキストファイル形式であり、高品質な組版のためのTeXベースのドキュメント準備システムで使用されます。

PDFファイルをTeXに変換するには、Aspose.PDFにはLaTeXSaveOptionsというクラスがあり、変換プロセス中に一時的な画像を保存するためのOutDirectoryPathプロパティを提供しています。

次のコードスニペットは、PythonでPDFファイルをTEX形式に変換するプロセスを示しています。


    import aspose.pdf as ap

    input_pdf = DIR_INPUT + "sample.pdf"
    output_pdf = DIR_OUTPUT + "convert_pdf_to_tex.tex"
    # PDFドキュメントを開く
    document = ap.Document(input_pdf)
    # LaTeXSaveOptionsのオブジェクトをインスタンス化
    saveOptions = ap.LaTeXSaveOptions()
    document.save(output_pdf, saveOptions)

PDFをテキストに変換

Aspose.PDF for Pythonは、PDFドキュメント全体と単一ページをテキストファイルに変換することをサポートしています。

PDFドキュメントをテキストファイルに変換

‘TextDevice’クラスを使用してPDFドキュメントをTXTファイルに変換することができます。

次のコードスニペットは、すべてのページからテキストを抽出する方法を説明します。


    import aspose.pdf as ap

    input_pdf = DIR_INPUT + "sample.pdf"
    output_pdf =  DIR_OUTPUT + "convert_pdf_to_txt.txt"
    # PDFドキュメントを開く
    document = ap.Document(input_pdf)

    # テキストデバイスを作成
    textDevice = ap.devices.TextDevice()

    # 特定のページを変換して保存
    textDevice.process(document.pages[1], output_pdf)

PDFをテキストにオンラインで変換してみる

PDFをXPSに変換する

Aspose.PDF for Pythonは、PDFファイルをXPS形式に変換する可能性を提供します。PythonでPDFファイルをXPS形式に変換するために提示されたコードスニペットを使ってみましょう。

XPSファイルタイプは、主にMicrosoft CorporationによるXML Paper Specificationに関連付けられています。XML Paper Specification(XPS)は、以前はMetroというコードネームで呼ばれ、Next Generation Print Path(NGPP)というマーケティングコンセプトを包含しており、Windowsオペレーティングシステムに文書の作成と閲覧を統合するためのMicrosoftの取り組みです。

PDFファイルをXPSに変換するには、Aspose.PDFにはXpsSaveOptionsクラスがあり、これはXPSファイルを生成するためにsave()メソッドの第2引数として使用されます。

次のコードスニペットは、PDFファイルをXPS形式に変換するプロセスを示しています。


    import aspose.pdf as ap

    input_pdf = DIR_INPUT + "sample.pdf"
    output_pdf = DIR_OUTPUT + "convert_pdf_to_xps.xps"
    # PDFドキュメントを開く
    document = ap.Document(input_pdf)

    # XPS保存オプションをインスタンス化
    save_options = ap.XpsSaveOptions()

    # XPSドキュメントを保存
    document.save(output_pdf, save_options)

PDFをXMLに変換

XMLは、任意のデータを保存、送信、再構築するためのマークアップ言語およびファイル形式です。

Aspose.PDF for Pythonは、PDFドキュメントをXML形式に変換する機能もサポートしています。Aspose.PDF for Pythonには「XmlSaveOptions」というクラスがあり、save()メソッドの第2引数として使用して、XMLファイルを生成することができます。この要件をPythonで達成するために、次のコードスニペットを試してください。


    import aspose.pdf as ap

    def convert_pdf_to_xml(self, infile, outfile):
        path_infile = self.dataDir + infile
        path_outfile = self.dataDir + outfile

        # PDFドキュメントを開く

        document = ap.Document(path_infile)

        # XML保存オプションをインスタンス化
        save_options = ap.XmlSaveOptions()

        # XMLドキュメントを保存
        document.save(path_outfile, save_options)
        print(infile + " が " + outfile + " に変換されました")