Извлечение текста из штампов с использованием C#
Contents
[
Hide
]
Извлечение текста из аннотаций штампов
Aspose.PDF для NET позволяет извлекать текст из аннотаций штампов. Для извлечения текста из аннотаций штампов в PDF можно использовать следующие шаги.
- Создайте объект класса
Document
- Получите нужную
Annotation
из списка аннотаций страницы - Определите новый объект класса
TextAbsorber
- Используйте метод visit класса TextAbsorber, чтобы получить текст
Следующий фрагмент кода также работает с библиотекой Aspose.PDF.Drawing.
public static void ExtractText()
{
Document document = new Document(_dataDir + "ExtractStampText.pdf");
Annotation item = document.Pages[1].Annotations[1];
if (item is StampAnnotation annot) {
TextAbsorber ta = new TextAbsorber();
XForm ap = annot.Appearance["N"];
ta.Visit(ap);
Console.WriteLine(ta.Text);
}
}