Porteur de projet :
Silvia FEDERZONI, (équipe LLL)
Année de l’appel :
2026
Ce projet vise à constituer et diffuser une ressource ouverte dédiée à l’étude de la coréférence en interaction orale, en articulant deux dimensions rarement combinées dans les corpus existants : les chaînes de référence et l’organisation séquentielle des interactions. Il repose sur l’enrichissement du corpus oral ANCOR, par l’intégration de nouveaux extraits issus du corpus ESLO, afin d’augmenter la taille de la ressource et de diversifier les situations interactionnelles prises en compte (conversations informelles, repas, entretiens). Les données seront annotées à la fois en coréférence, selon le modèle ANCOR, et en séquences interactionnelles, grâce à l’élaboration d’un guide d’annotation spécifique. Cette double annotation permettra d’analyser comment les référents sont introduits, maintenus ou redéfinis au fil de l’échange, et comment les chaînes de référence se distribuent et se transforment selon les séquences d’interaction (planification, négociation, digressions). Les livrables — corpus annoté et guides d’annotation — seront diffusés en libre accès et constitueront une ressource méthodologique et empirique pour les recherches en linguistique de l’oral, analyse des interactions et traitement automatique des langues.
