Expertise IA

De l’IA, oui, mais de quoi parle-t-on ?

L’Intelligence Artificielle (IA) regroupe un nombre important de méthodes et d’algorithmes différents,  avec des contraintes sur des données de tous types (numériques, symboliques) qui diffèrent selon les objectifs recherchés. Assez vite, par IA on entend des méthodes d’apprentissage qui vont permettre de modéliser un ensemble de données et ainsi pouvoir effectuer 1) soit des prédictions pour des problèmes de classification ou bien 2) des régressions pour prédire/estimer des valeurs.

L’Apprentissage Machine (Machine Learning ou ML) ou bien la sous-catégorie Apprentissage profond (Deep Learning) sont souvent cités et utilisés. Ces types d’apprentissage sont spécifiques et ne sont pas applicables à tous types de données. Très grossièrement, il y a deux grandes familles d’apprentissages possibles :

  • l’apprentissage dit supervisé (il a besoin de connaissances humaines expertes à apporter, les connaissances « à priori »)
  • l’apprentissage dit non-supervisé (les méthodes n’ont pas besoin de ces connaissances « a priori »)

Selon les objectifs l’une ou l’autre de ces méthodes est mise en œuvre.

Enfin, pour les méthodes d’apprentissage, il y a toujours deux phases distinctes : la construction du modèle (l’apprentissage) puis la phase d’utilisation du modèle (dite d’inférence ou de prédiction). Ces phases ne doivent bien entendu pas être pensées et réalisées sur des ensembles de données disjoints. La phase d’apprentissage est un processus qui peut être assez long en fonction de la méthode choisie. C’est un processus souvent itératif que l’on arrête sur un critère de « qualité de modélisation » à atteindre ou atteint.

Lollixzc, CC BY-SA 4.0, via Wikimedia Commons

Sur quelles données ?

Sans forcément être limitatif, l’expertise du service porte principalement sur des données dites complexes (Images, 3D (nuages de points) et vectorielles). Les images peuvent être multi-dimensionnelles (2D, 2D+t = videos, 3D, 3D+t …) de résolution et de sources variables. Les données LIDAR sont des données qui peuvent se trouver sous forme image ou bien nuages de points, 3D. Les données vectorielles sont une représentation de nombreuses données (résultats d’enquêtes, tables de bases de données, etc.). Les données audios, n’ont pas été jusqu’ici explorées dans les précédentes projets, mais des méthodes existent pour imaginer des traitements automatiques. Les données textes en langage naturel sont également traitables par des modèles existants que l’on peut aider à mettre en œuvre.

Quels types de traitements ?

Les types de traitements sont assez variables selon les données :

Images :

  • Rechercher un motif, portion d’une image, dans une collection d’images
  • Classer des images, attribuer une étiquette aux images par rapport à une thématique
  • Retrouver des images semblables dans une collection, à partir d’un échantillon unique
  • Découper une image selon les éléments qui la composent (visages, mains, couleurs, textures, etc..)
  • Comparer des images
  • Compter des éléments d’une image

Nuages de points :

  • Retrouver des motifs dans des nuages de points
  • Retrouver des plans horizontaux, verticaux, des objets particuliers (« sphériques », …)
  • Compter des éléments connus, comme des structures remarquables répétées

Sons :

  • Rechercher un motif dans une collection sonore
  • Classer des sons, attribuer une étiquette aux sons par rapport à une thématique
  • Retrouver des sons semblables dans une collection, à partir d’un échantillon sonore unique

Textes :

  • Rechercher un motif, portion d’un texte, dans une collection de corpus
  • Classer un texte, attribuer une étiquette aux textes par rapport à une thématique
  • Retrouver des textes ou portions de textes semblables dans une collection, à partir d’un échantillon unique de référence
  • Découper un texte sémantiquement, isoler des paragraphes et comparer

 

Pour faire appel à l’expertise du service, vous pouvez contacter Barthélemy Serres

Quelques réalisations

 

VECCAR – Vectorisation de cartes anciennes

CANAPAI – Extraction d’information spatiale
des CAdastres NAPoléoniens par l’Intelligence Artificielle