Analyser des documents PDF

Contents
[ ]

Analyser des documents PDF est un terme lié à l’extraction de divers types d’informations à partir de fichiers PDF. Cette section couvre comment :

  • Extraire du texte d’un PDF. L’analyse ou l’extraction de texte est l’opération la plus populaire avec des PDF prêts à l’emploi. Vous apprendrez à analyser le texte d’un document entier, d’une page particulière ou d’une région particulière d’une page.
  • Extraire des images d’un PDF. L’extraction d’images fait la même chose pour les images que l’opération ci-dessus pour le texte.
  • Extraire des polices d’un PDF. L’extraction de polices est une opération spécifique avec les polices dans les PDF.
  • Extraire des données du formulaire. Si vous avez un ensemble de documents PDF avec des formulaires, vous devez probablement obtenir les données de ces formulaires. Cet article vous aidera à comprendre comment extraire les données des AcroForms avec Aspose.PDF for .NET.
  • Extraire du texte des tampons - obtenir des informations textuelles de votre document PDF.
  • Extraire des données d’un tableau - obtenir des données d’un tableau dans un document PDF.
  • Extraire des données vectorielles d’un PDF - vous pouvez obtenir les données vectorielles (chemin, polygone, polyligne), telles que la position, la couleur, l’épaisseur de ligne, etc.