Конвертировать PDF файл в другие форматы

Конвертировать PDF в EPUB

EPUB (сокращение от электронная публикация) — это бесплатный и открытый стандарт электронных книг от Международного форума цифровых публикаций (IDPF). Файлы имеют расширение .epub. EPUB предназначен для содержимого с возможностью переноса, что означает, что EPUB-ридер может оптимизировать текст для конкретного устройства отображения. EPUB также поддерживает содержимое с фиксированной версткой. Формат предназначен как единый формат, который издатели и конверсионные компании могут использовать внутри компании, а также для распространения и продажи. Он заменяет стандарт Open eBook.

Aspose.PDF для PHP поддерживает функцию конвертации документов PDF в формат EPUB. Aspose.PDF для PHP имеет класс под названием EpubSaveOptions, который может быть использован в качестве второго аргумента к методу Document.save(..), чтобы создать файл EPUB. Пожалуйста, попробуйте использовать следующий фрагмент кода для выполнения этого требования.

// Создайте новый экземпляр класса Document и загрузите входной PDF файл
$document = new Document($inputFile);

// Создайте новый экземпляр класса EpubSaveOptions
$saveOption = new EpubSaveOptions();

// Сохраните документ в формате EPUB, используя указанные параметры сохранения
$document->save($outputFile, $saveOption);

Convert PDF to LaTeX/TeX

Aspose.PDF for PHP поддерживает преобразование PDF в LaTeX/TeX. Формат файла LaTeX — это текстовый формат файла со специальной разметкой, используемый в системе подготовки документов на основе TeX для высококачественной вёрстки.

Чтобы преобразовать PDF-файлы в TeX, Aspose.PDF имеет класс LaTeXSaveOptions, который предоставляет метод setOutDirectoryPath для сохранения временных изображений в процессе конверсии.

Следующий фрагмент кода показывает процесс преобразования PDF-файлов в формат TEX с использованием Java.

// Создайте новый объект Document и загрузите входной PDF-файл
$document = new Document($inputFile);

// Создайте новый объект LaTeXSaveOptions
$saveOption = new LaTeXSaveOptions();
$saveOption->setOutDirectoryPath ($pathToOutputDirectory)

// Сохраните документ как LaTeX
$document->save($outputFile, $saveOption);

Конвертировать PDF в Текст

Aspose.PDF для PHP поддерживает преобразование всего PDF документа и отдельной страницы в текстовый файл.

Конвертировать весь PDF документ в текстовый файл

Вы можете конвертировать PDF документ в TXT файл, используя метод Visit класса TextAbsorber.

Следующий фрагмент кода объясняет, как извлечь текст со всех страниц.

// Загрузить PDF документ
$document = new Document($inputFile);

// Создать объект TextAbsorber для извлечения текста из документа
$textAbsorber = new TextAbsorber();

// Извлечь текст из документа
$textAbsorber->visit($document);
$content = $textAbsorber->getText();

// Сохранить извлеченный текст в выходной файл
file_put_contents($outputFile, $content);

// Получить размер файла выходного файла
$fileSize = filesize($outputFile);

Конвертация страницы PDF в текстовый файл

Вы можете конвертировать PDF-документ в TXT-файл с помощью Aspose.PDF для PHP. Вам следует использовать метод Visit класса TextAbsorber для выполнения этой задачи.

Следующий фрагмент кода объясняет, как извлечь текст из конкретных страниц.

// Загрузить PDF-документ
$document = new Document($inputFile);

// Создать объект TextAbsorber для извлечения текста из документа
$textAbsorber = new TextAbsorber();

$array = array(1, 3, 4);

foreach ($array as $page) {
    $textAbsorber->visit($document->getPages()->get_Item($page));
    $content = $textAbsorber->getText();
    
    $outputFile = $dataDir . DIRECTORY_SEPARATOR . 'result-pdf-to-text'. $page . '.txt';
    // Сохранить извлеченный текст в выходной файл
    file_put_contents($outputFile, $content);
}

Convert PDF to XPS

Aspose.PDF для PHP предоставляет возможность конвертировать PDF файлы в формат XPS. Давайте попробуем использовать представленный фрагмент кода для конвертирования PDF файлов в формат XPS с помощью Java.

Тип файла XPS в первую очередь ассоциируется с XML Paper Specification от Microsoft Corporation. XML Paper Specification (XPS), ранее известный под кодовым названием Metro и охватывающий маркетинговую концепцию Next Generation Print Path (NGPP), является инициативой Microsoft по интеграции создания и просмотра документов в операционную систему Windows.

Для конвертации PDF файлов в XPS, Aspose.PDF имеет класс XpsSaveOptions, который используется в качестве второго аргумента в конструкторе Document.save(..) для генерации XPS файла. Следующий фрагмент кода показывает процесс преобразования PDF файлов в формат XPS.

// Создать новый объект Document и загрузить входной PDF файл
$document = new Document($inputFile);

// Создать новый объект XpsSaveOptions
$saveOption = new XpsSaveOptions();

// Сохранить документ как XPS, используя указанные параметры сохранения
$document->save($outputFile, $saveOption);