Извлечение ссылок из PDF-файла

Извлечение ссылок из PDF-файла

Ссылки представлены как аннотации в PDF-файле, поэтому для извлечения ссылок извлеките все объекты LinkAnnotation.

  1. Создайте объект Document.

  2. Получите Page, с которой вы хотите извлечь ссылки.

  3. Используйте класс AnnotationSelector для извлечения всех объектов LinkAnnotation с указанной страницы.

  4. Передайте объект AnnotationSelector методу Accept объекта Page.

  5. Получите все выбранные аннотации ссылок в объект IList, используя метод getSelected объекта AnnotationSelector.

Следующий фрагмент кода показывает, как извлечь ссылки из PDF-файла.

    public static void ExtractLinksFromThePDFFile() {        
        // Загрузите PDF-файл
        Document document = new Document(_dataDir + "UpdateLinks.pdf");
        Page page = document.getPages().get_Item(1);
           
        AnnotationSelector selector = new AnnotationSelector(new LinkAnnotation(page, Rectangle.getTrivial()));
        page.accept(selector);
        java.util.List<Annotation> list = selector.getSelected();
        for(Annotation annot : list)
        {
            System.out.println("Аннотация расположена: " + annot.getRect());
        }
                
        // Сохраните документ с обновленной ссылкой
        //document.save(_dataDir + "ExtractLinks_out.pdf");
    }