Expertise IA

De l’IA, oui, mais de quoi parle-t-on ?

L’Intelligence Artificielle (IA) regroupe un nombre important de méthodes et d’algorithmes différents, avec des contraintes sur des données de tous types (numériques, symboliques) qui diffèrent selon les objectifs recherchés. Assez vite, par IA on entend des méthodes d’apprentissage qui vont permettre de modéliser un ensemble de données et ainsi pouvoir effectuer 1) soit des prédictions pour des problèmes de classification ou bien 2) des régressions pour prédire/estimer des valeurs.

L’Apprentissage Machine (Machine Learning ou ML) ou bien la sous-catégorie Apprentissage profond (Deep Learning) sont souvent cités et utilisés. Ces types d’apprentissage sont spécifiques et ne sont pas applicables à tous types de données. Très grossièrement, il y a deux grandes familles d’apprentissages possibles :

l’apprentissage dit supervisé (il a besoin de connaissances humaines expertes à apporter, les connaissances « à priori »)
l’apprentissage dit non-supervisé (les méthodes n’ont pas besoin de ces connaissances « a priori »)

Selon les objectifs l’une ou l’autre de ces méthodes est mise en œuvre.

Enfin, pour les méthodes d’apprentissage, il y a toujours deux phases distinctes : la construction du modèle (l’apprentissage) puis la phase d’utilisation du modèle (dite d’inférence ou de prédiction). Ces phases ne doivent bien entendu pas être pensées et réalisées sur des ensembles de données disjoints. La phase d’apprentissage est un processus qui peut être assez long en fonction de la méthode choisie. C’est un processus souvent itératif que l’on arrête sur un critère de « qualité de modélisation » à atteindre ou atteint.

Lollixzc, CC BY-SA 4.0, via Wikimedia Commons

Sur quelles données ?

Sans forcément être limitatif, l’expertise du service porte principalement sur des données dites complexes (Images, 3D (nuages de points) et vectorielles). Les images peuvent être multi-dimensionnelles (2D, 2D+t = videos, 3D, 3D+t …) de résolution et de sources variables. Les données LIDAR sont des données qui peuvent se trouver sous forme image ou bien nuages de points, 3D. Les données vectorielles sont une représentation de nombreuses données (résultats d’enquêtes, tables de bases de données, etc.). Les données audios, n’ont pas été jusqu’ici explorées dans les précédentes projets, mais des méthodes existent pour imaginer des traitements automatiques. Les données textes en langage naturel sont également traitables par des modèles existants que l’on peut aider à mettre en œuvre.

Quels types de traitements ?

Les types de traitements sont assez variables selon les données :

Images :

Rechercher un motif, portion d’une image, dans une collection d’images
Classer des images, attribuer une étiquette aux images par rapport à une thématique
Retrouver des images semblables dans une collection, à partir d’un échantillon unique
Découper une image selon les éléments qui la composent (visages, mains, couleurs, textures, etc..)
Comparer des images
Compter des éléments d’une image

Nuages de points :

Retrouver des motifs dans des nuages de points
Retrouver des plans horizontaux, verticaux, des objets particuliers (« sphériques », …)
Compter des éléments connus, comme des structures remarquables répétées

Sons :

Rechercher un motif dans une collection sonore
Classer des sons, attribuer une étiquette aux sons par rapport à une thématique
Retrouver des sons semblables dans une collection, à partir d’un échantillon sonore unique

Textes :

Rechercher un motif, portion d’un texte, dans une collection de corpus
Classer un texte, attribuer une étiquette aux textes par rapport à une thématique
Retrouver des textes ou portions de textes semblables dans une collection, à partir d’un échantillon unique de référence
Découper un texte sémantiquement, isoler des paragraphes et comparer

Le service expertise IA :

L’atelier numérique peut vous accompagner dans vos projets d’IA en vous conseillant

lors des discussions préalables au montage des projets
sur les objectifs atteignables
sur le dimensionnement des moyens, etc

Le développement des modèles d’apprentissage ne pourra être pris en charge par l’atelier numérique et devra être confié à une autre structure comme, par exemple, le Centre d’Expertise et de Transfert Universitaire (CETU) de l’Université de Tours dédié à la valorisation de la Recherche dans le domaine de l’ingénierie logicielle en traitement d’images et numérisation 3D Iliad3.

Contact :

Pour demander l’expertise de votre projet, vous pouvez contacter Barthélemy Serres

Quelques réalisations

VECCAR – Vectorisation de cartes anciennes

CANAPAI – Extraction d’information spatiale
des CAdastres NAPoléoniens par l’Intelligence Artificielle