TEMPORAL

Porteur de projet :
Emmanuel SCHANG, Laboratoire Ligérien de Linguitique (LLL) – UMR 7270

Partenaires :
Laboratoire Ligérien de Linguitique (LLL) – UMR 7270
Laboratoire d’Informatique de l’Université de Tours (LI) – EA 6300

Année de l’Appel à projet:
2013

Le projet TEMPORAL vise à la construction d’un corpus numérique oral annoté en référence et coréférence temporelle sans équivalent à l’heure actuelle. Alors que les avancées qu’a connues l’ingénierie des langues ont ouvert la porte à des applications efficaces en termes de recherche d’information langagière, la question du repérage temporel d’événements dans des documents (textuels ou sonores) reste ouverte, de même que celle de leurs relations (coréférence temporelle). Elle est pourtant essentielle pour nombre d’applications en recherche d’informations.

Le corpus TEMPORAL sera diffusé librement sous licence Creative Commons et constituera la première ressources de ce type en langue française. Par sa richesse d’annotation, il sera utile aussi bien aux chercheurs en sciences du langage (linguistique et linguistique de corpus) qu’à ceux du traitement automatique des langues (ingénierie du langage).

Nous reprenons en ce sens la démarche et le partenariat du projet ANCOR (APR-IA Région Centre) qui a donné lieu à la création du plus grand corpus oral (488 000 mots) annoté en coréférence nominale actuellement disponible, toutes langues confondues. Afin de donner la même visibilité au corpus TEMPORAL, ce dernier portera sur les mêmes données que le corpus ANCOR_Centre (nouvelle couche d’annotation).

Projet financé à hauteur de 7000€.