Ekstrak Tautan dari File PDF

Ekstrak Tautan dari File PDF

Tautan diwakili sebagai anotasi dalam file PDF, jadi untuk mengekstrak tautan, ekstrak semua objek LinkAnnotation.

  1. Buat objek Document.

  2. Dapatkan Page yang ingin Anda ekstrak tautannya.

  3. Gunakan kelas AnnotationSelector untuk mengekstrak semua objek LinkAnnotation dari halaman yang ditentukan.

  4. Berikan objek AnnotationSelector ke metode Accept dari objek Page.

  5. Dapatkan semua anotasi tautan yang dipilih ke dalam objek IList menggunakan metode getSelected dari objek AnnotationSelector.

Cuplikan kode berikut menunjukkan cara mengekstrak tautan dari file PDF.

    public static void ExtractLinksFromThePDFFile() {        
        // Memuat file PDF
        Document document = new Document(_dataDir + "UpdateLinks.pdf");
        Page page = document.getPages().get_Item(1);
           
        AnnotationSelector selector = new AnnotationSelector(new LinkAnnotation(page, Rectangle.getTrivial()));
        page.accept(selector);
        java.util.List<Annotation> list = selector.getSelected();
        for(Annotation annot : list)
        {
            System.out.println("Anotasi terletak: " + annot.getRect());
        }
                
        // Simpan dokumen dengan tautan yang diperbarui
        //document.save(_dataDir + "ExtractLinks_out.pdf");
    }