Extraire les Liens du Fichier PDF

Extraire les Liens du Fichier PDF

Les liens sont représentés sous forme d’annotations dans un fichier PDF, donc pour extraire les liens, extrayez tous les objets LinkAnnotation.

  1. Créez un objet Document.

  2. Obtenez la Page à partir de laquelle vous souhaitez extraire les liens.

  3. Utilisez la classe AnnotationSelector pour extraire tous les objets LinkAnnotation de la page spécifiée.

  4. Passez l’objet AnnotationSelector à la méthode Accept de l’objet Page.

  5. Obtenez toutes les annotations de lien sélectionnées dans un objet IList en utilisant la méthode getSelected de l’objet AnnotationSelector.

Le code suivant vous montre comment extraire des liens d’un fichier PDF.

    public static void ExtractLinksFromThePDFFile() {        
        // Charger le fichier PDF
        Document document = new Document(_dataDir + "UpdateLinks.pdf");
        Page page = document.getPages().get_Item(1);
           
        AnnotationSelector selector = new AnnotationSelector(new LinkAnnotation(page, Rectangle.getTrivial()));
        page.accept(selector);
        java.util.List<Annotation> list = selector.getSelected();
        for(Annotation annot : list)
        {
            System.out.println("Annotation localisée : " + annot.getRect());
        }
                
        // Enregistrer le document avec le lien mis à jour
        //document.save(_dataDir + "ExtractLinks_out.pdf");
    }