Извлечение ссылок из PDF-файла
Contents
[
Hide
]
Извлечение ссылок из PDF-файла
Ссылки представлены как аннотации в PDF-файле, поэтому для извлечения ссылок извлеките все объекты LinkAnnotation.
-
Создайте объект Document.
-
Получите Page, с которой вы хотите извлечь ссылки.
-
Используйте класс AnnotationSelector для извлечения всех объектов LinkAnnotation с указанной страницы.
-
Передайте объект AnnotationSelector методу Accept объекта Page.
-
Получите все выбранные аннотации ссылок в объект IList, используя метод getSelected объекта AnnotationSelector.
Следующий фрагмент кода показывает, как извлечь ссылки из PDF-файла.
public static void ExtractLinksFromThePDFFile() {
// Загрузите PDF-файл
Document document = new Document(_dataDir + "UpdateLinks.pdf");
Page page = document.getPages().get_Item(1);
AnnotationSelector selector = new AnnotationSelector(new LinkAnnotation(page, Rectangle.getTrivial()));
page.accept(selector);
java.util.List<Annotation> list = selector.getSelected();
for(Annotation annot : list)
{
System.out.println("Аннотация расположена: " + annot.getRect());
}
// Сохраните документ с обновленной ссылкой
//document.save(_dataDir + "ExtractLinks_out.pdf");
}