PDFファイルを他の形式に変換する

PDFをEPUBに変換

EPUB(電子出版物の略)は、国際デジタル出版フォーラム(IDPF)による無料でオープンな電子書籍の標準です。 ファイルは拡張子.epubを持っています。EPUBはリフロー可能なコンテンツ用に設計されており、EPUBリーダーは特定の表示デバイスに最適化されたテキストを表示することができます。EPUBは固定レイアウトコンテンツもサポートしています。このフォーマットは、出版社や変換ハウスが社内で使用するための単一のフォーマットとして意図されており、配布や販売にも使用されます。Open eBook標準に取って代わるものです。

Aspose.PDF for PHPは、PDFドキュメントをEPUB形式に変換する機能をサポートしています。Aspose.PDF for PHPにはEpubSaveOptionsという名前のクラスがあり、Document.save(..)メソッドの第二引数として使用して、EPUBファイルを生成することができます。この要件を達成するために、以下のコードスニペットを使用してください。

// Documentクラスの新しいインスタンスを作成し、入力PDFファイルをロードします
$document = new Document($inputFile);

// EpubSaveOptionsクラスの新しいインスタンスを作成します
$saveOption = new EpubSaveOptions();

// 指定された保存オプションを使用して、ドキュメントをEPUB形式で保存します
$document->save($outputFile, $saveOption);

PDFをLaTeX/TeXに変換する

Aspose.PDF for PHPは、PDFをLaTeX/TeXに変換することをサポートしています。 LaTeXファイル形式は、特別なマークアップを持つテキストファイル形式であり、高品質な組版のためにTeXベースのドキュメント準備システムで使用されます。

PDFファイルをTeXに変換するには、Aspose.PDFには変換プロセス中に一時的な画像を保存するためのsetOutDirectoryPathメソッドを提供するクラスLaTeXSaveOptionsがあります。

以下のコードスニペットは、JavaでPDFファイルをTEX形式に変換するプロセスを示しています。

// 新しいDocumentオブジェクトを作成し、入力PDFファイルを読み込む
$document = new Document($inputFile);

// 新しいLaTeXSaveOptionsオブジェクトを作成
$saveOption = new LaTeXSaveOptions();
$saveOption->setOutDirectoryPath ($pathToOutputDirectory)

// ドキュメントをLaTeXとして保存
$document->save($outputFile, $saveOption);

PDFをテキストに変換

Aspose.PDF for PHPは、PDFドキュメント全体および単一ページをテキストファイルに変換することをサポートしています。

PDFドキュメント全体をテキストファイルに変換

TextAbsorberクラスのVisitメソッドを使用して、PDFドキュメントをTXTファイルに変換できます。

次のコードスニペットは、すべてのページからテキストを抽出する方法を説明しています。

// PDFドキュメントをロードする
$document = new Document($inputFile);

// ドキュメントからテキストを抽出するためのTextAbsorberオブジェクトを作成する
$textAbsorber = new TextAbsorber();

// ドキュメントからテキストを抽出する
$textAbsorber->visit($document);
$content = $textAbsorber->getText();

// 抽出したテキストを出力ファイルに保存する
file_put_contents($outputFile, $content);

// 出力ファイルのファイルサイズを取得する
$fileSize = filesize($outputFile);

PDFページをテキストファイルに変換する

Aspose.PDF for PHPを使用して、PDFドキュメントをTXTファイルに変換できます。このタスクを解決するには、TextAbsorberクラスのVisitメソッドを使用する必要があります。

次のコードスニペットは、特定のページからテキストを抽出する方法を説明しています。

// PDFドキュメントを読み込む
$document = new Document($inputFile);

// ドキュメントからテキストを抽出するためのTextAbsorberオブジェクトを作成する
$textAbsorber = new TextAbsorber();

$array = array(1, 3, 4);

foreach ($array as $page) {
    $textAbsorber->visit($document->getPages()->get_Item($page));
    $content = $textAbsorber->getText();
    
    $outputFile = $dataDir . DIRECTORY_SEPARATOR . 'result-pdf-to-text'. $page . '.txt';
    // 抽出したテキストを出力ファイルに保存する
    file_put_contents($outputFile, $content);
}

PDFをXPSに変換する

Aspose.PDF for PHPは、PDFファイルをXPS形式に変換する機能を提供します。Javaを使用してPDFファイルをXPS形式に変換するためのコードスニペットを試してみましょう。

XPSファイルタイプは主にMicrosoft CorporationによるXML Paper Specificationに関連付けられています。XML Paper Specification (XPS)は、かつてMetroというコードネームで呼ばれており、次世代印刷パス(NGPP)のマーケティングコンセプトを包含しているもので、Windowsオペレーティングシステムに文書作成と閲覧を統合するためのMicrosoftの取り組みです。

PDFファイルをXPSに変換するために、Aspose.PDFにはXpsSaveOptionsクラスがあり、これはDocument.save(..)コンストラクタの第2引数として使用され、XPSファイルを生成するために使用されます。 以下のコードスニペットは、PDFファイルをXPS形式に変換するプロセスを示しています。

// 新しいDocumentオブジェクトを作成し、入力PDFファイルを読み込む
$document = new Document($inputFile);

// 新しいXpsSaveOptionsオブジェクトを作成する
$saveOption = new XpsSaveOptions();

// 指定された保存オプションを使用してドキュメントをXPSとして保存する
$document->save($outputFile, $saveOption);