Извлечение текста из штампов с использованием C#

Извлечение текста из аннотаций штампов

Aspose.PDF для NET позволяет извлекать текст из аннотаций штампов. Для извлечения текста из аннотаций штампов в PDF можно использовать следующие шаги.

  1. Создайте объект класса Document
  2. Получите нужную Annotation из списка аннотаций страницы
  3. Определите новый объект класса TextAbsorber
  4. Используйте метод visit класса TextAbsorber, чтобы получить текст

Следующий фрагмент кода также работает с библиотекой Aspose.PDF.Drawing.

public static void ExtractText()
{
   Document document = new Document(_dataDir + "ExtractStampText.pdf");
   Annotation item = document.Pages[1].Annotations[1];
   if (item is StampAnnotation annot) {
         TextAbsorber ta = new TextAbsorber();
         XForm ap = annot.Appearance["N"];
         ta.Visit(ap);
         Console.WriteLine(ta.Text);
   }
}