PDFをHTMLに変換するPython

概要

この記事では、Pythonを使用してPDFをHTMLに変換する方法を説明します。これらのトピックをカバーします。

形式: HTML

PDFをHTMLに変換

.NET経由のAspose.PDF for Pythonは、さまざまなファイル形式をPDFドキュメントに変換し、PDFファイルをさまざまな出力形式に変換するための多くの機能を提供します。 この記事では、PDFファイルをHTMLに変換する方法について説明します。PDFをHTMLに変換するために、Pythonのほんの数行のコードを使用することができます。ウェブサイトを作成したり、オンラインフォーラムにコンテンツを追加したりする場合、PDFをHTMLに変換する必要があるかもしれません。PDFをHTMLに変換する一つの方法は、Pythonを使用してプログラム的に行うことです。

ステップ: PythonでPDFをHTMLに変換する

  1. ソースPDFドキュメントを使用してDocumentオブジェクトのインスタンスを作成します。
  2. Document.save() メソッドを呼び出して、HtmlSaveOptions に保存します。
from asposepdf import Api

documentName = "../../testdata/source.pdf"
documentOutName = "../../testout/result.html"
# PDFドキュメントを開く
document = Api.Document(documentName)

# ドキュメントをHTML形式で保存
save_options = Api.HtmlSaveOptions()
document.save(documentOutName, save_options)

関連項目

この記事は次のトピックもカバーしています。コードは上記と同じです。

フォーマット: HTML