Extraer Enlaces del Archivo PDF

Extraer Enlaces del Archivo PDF

Los enlaces están representados como anotaciones en un archivo PDF, por lo que para extraer enlaces, extraiga todos los objetos LinkAnnotation.

  1. Cree un objeto Document.

  2. Obtenga la Page de la que desea extraer enlaces.

  3. Use la clase AnnotationSelector para extraer todos los objetos LinkAnnotation de la página especificada.

  4. Pase el objeto AnnotationSelector al método Accept del objeto Page.

  5. Obtenga todas las anotaciones de enlace seleccionadas en un objeto IList utilizando el método getSelected del objeto AnnotationSelector.

El siguiente fragmento de código le muestra cómo extraer enlaces de un archivo PDF.

    public static void ExtractLinksFromThePDFFile() {        
        // Cargar el archivo PDF
        Document document = new Document(_dataDir + "UpdateLinks.pdf");
        Page page = document.getPages().get_Item(1);
           
        AnnotationSelector selector = new AnnotationSelector(new LinkAnnotation(page, Rectangle.getTrivial()));
        page.accept(selector);
        java.util.List<Annotation> list = selector.getSelected();
        for(Annotation annot : list)
        {
            System.out.println("Anotación localizada: " + annot.getRect());
        }
                
        // Guardar el documento con el enlace actualizado
        //document.save(_dataDir + "ExtractLinks_out.pdf");
    }