Извлечение текста из штампов
Contents
[
Hide
]
Извлечение текста из аннотаций штампов
Aspose.PDF for C++ позволяет извлекать текст из аннотаций штампов. Чтобы извлечь текст из аннотаций штампов в PDF, можно использовать следующие шаги.
- Создайте объект класса Document
- Получите желаемую аннотацию из списка аннотаций страницы
- Определите новый объект класса TextAbsorber
- Используйте метод visit класса TextAbsorber, чтобы получить текст
void Parsing::ExtractTextFromStamp()
{
std::clog << __func__ << ": Start" << std::endl;
// Строка для имени пути
String _dataDir("C:\\Samples\\Parsing\\");
// Строка для имени файла
String infilename("ExtractStampText.pdf");
auto document = MakeObject<Document>(_dataDir + infilename);
auto item = document->get_Pages()->idx_get(1)->get_Annotations()->idx_get(1);
if (item->get_AnnotationType() == Annotations::AnnotationType::Stamp) {
auto annot = System::DynamicCast<Aspose::Pdf::Annotations::StampAnnotation>(item);
auto ta = MakeObject<TextAbsorber>();
auto ap = annot->get_Appearance()->idx_get(u"N");
ta->Visit(ap);
Console::WriteLine(ta->get_Text());
}
}