Создание тегированного PDF с использованием C#

Создание тегированного PDF означает добавление (или создание) определенных элементов в документ, которые позволят документу пройти проверку на соответствие с требованиями PDF/UA. Эти элементы часто называются элементами структуры.

Следующие фрагменты кода также работают с библиотекой Aspose.PDF.Drawing.

Создание тегированного PDF (Простой сценарий)

Для создания элементов структуры в тегированном PDF документе Aspose.PDF предлагает методы для создания элементов структуры с использованием интерфейса ITaggedContent. Следующий фрагмент кода показывает, как создать тегированный PDF, который содержит 2 элемента: заголовок и абзац.

Мы получим следующий документ после создания:

Тегированный PDF документ с 2 элементами - Заголовок и Абзац

Создание тегированного PDF с вложенными элементами (Создание дерева элементов структуры)

В некоторых случаях нам нужно создать более сложную структуру, например, разместить цитаты в абзаце. Для создания дерева элементов структуры мы должны использовать метод AppendChild. Следующий фрагмент кода показывает, как создать дерево элементов структуры тегированного PDF документа:

Мы получим следующий документ после создания: Тегированный PDF документ с вложенными элементами - span и цитаты

Стилизация структуры текста

Для стилизации структуры текста в тегированном PDF документе Aspose.PDF предлагает свойства Font, FontSize, FontStyle и ForegroundColor класса StructureTextState. Следующий фрагмент кода показывает, как стилизовать структуру текста в тегированном PDF документе:

Иллюстрация элементов структуры

Для иллюстрации элементов структуры в тегированном PDF документе Aspose.PDF предлагает класс IllustrationElement. Следующий фрагмент кода показывает, как иллюстрировать элементы структуры в тегированном PDF документе:

Проверка тегированного PDF

Aspose.PDF for .NET предоставляет возможность проверять соответствие PDF/UA тегированного PDF. Валидация стандарта PDF/UA поддерживает:

  • Проверки для XObjects.
  • Проверки для Actions.
  • Проверки для необязательного контента.
  • Проверки для встроенных файлов.
  • Проверки для полей Acroform (Проверка естественного языка и альтернативного имени и цифровых подписей).
  • Проверки для полей формы XFA.
  • Проверки для настроек безопасности.
  • Проверки для навигации.
  • Проверки для аннотаций.

Ниже приведен фрагмент кода, который показывает, как проверить тегированный PDF документ. Соответствующие проблемы будут отображены в XML отчете.

Настройка позиции структуры текста

Следующий фрагмент кода показывает, как настроить позицию структуры текста в тегированном PDF документе:

Автоматическое создание тегированного PDF с преобразованием PDF/UA-1

Aspose.PDF позволяет автоматически генерировать базовую разметку логической структуры при преобразовании документа в PDF/UA-1. Пользователи могут затем вручную улучшить эту базовую логическую структуру, предоставляя дополнительные сведения о содержимом документа.

Чтобы сгенерировать логическую структуру документа, создайте экземпляр класса Aspose.Pdf.AutoTaggingSettings, установите свойство AutoTaggingSettings.EnableAutoTagging в true и назначьте его свойству PdfFormatConversionOptions.AutoTaggingSettings.