Analyser des documents PDF

Analyser des documents PDF est un terme lié à l’extraction de divers types d’informations à partir de fichiers PDF. Cette section couvre comment :

Extraire du texte d’un PDF. L’analyse ou l’extraction de texte est l’opération la plus populaire avec des PDF prêts à l’emploi. Vous apprendrez à analyser le texte d’un document entier, d’une page particulière ou d’une région particulière d’une page.
Extraire des images d’un PDF. L’extraction d’images fait la même chose pour les images que l’opération ci-dessus pour le texte.
Extraire des polices d’un PDF. L’extraction de polices est une opération spécifique avec les polices dans les PDF.
Extraire des données du formulaire. Si vous avez un ensemble de documents PDF avec des formulaires, vous devez probablement obtenir les données de ces formulaires. Cet article vous aidera à comprendre comment extraire les données des AcroForms avec Aspose.PDF for .NET.
Extraire du texte des tampons - obtenir des informations textuelles de votre document PDF.
Extraire des données d’un tableau - obtenir des données d’un tableau dans un document PDF.
Extraire des données vectorielles d’un PDF - vous pouvez obtenir les données vectorielles (chemin, polygone, polyligne), telles que la position, la couleur, l’épaisseur de ligne, etc.

Convertir des documents PDF en utilisant l'API C# Opérations avancées