Séminaire MSH : Les corpus iconographiques

Date : 10/04/2014
Lieu : MSH Val de Loire à Tours & Salle de visoconférence à Orléans


Organisé dans le cadre du séminaire de l’atelier numérique de la MSH “Pratiques numériques en SHS”

Cette dernière session du 10 avril 2014 (de 14h00 à 17h00) sera consacrée aux corpus iconographiques.

Programme :

Romane : visite virtuelle d’une collection d’art roman par Aurélia Bolot-De Moussac (Centre Supérieures de Civilisation Médiévale (CESCM), UMR 7302, à Poitiers)
La base de données ROMANE, accessible via internet depuis janvier 2013, a pour objectif de permettre la consultation du fonds iconographique d’art roman du CESCM. La collection, constituée de plus de 160 000 clichés, offre une documentation qui couvre la France et une partie des pays européens tant dans les domaines de l’architecture, de la sculpture, de la peinture murale que dans ceux des manuscrits, de l’orfèvrerie, des vitraux. Un vaste programme d’indexation, de numérisation et de campagnes photographiques assure l’accroissement constant des données mises à disposition du public académique ou non.

> Un exemple de traitement de corpus iconographique par Sébastien Busson (Centre d’Etudes Supérieures de la Renaissance (CESR), UMR 7323, à Tours)

A noter que cette séance est organisée en collaboration avec l’Ecole Doctorale de Tours.

A Tours : rendez-vous à la MSH Val de Loire – 33 rue Ferdinand de Lesseps – Salle 147
A Orléans : session en visioconférence : rendez-vous salle Prony sur le site de Polytech Galilée

Compte-rendu

La base Romane du CESCM

La base Romane, développée par le CESCM, est une partie d’une grande photothèque rassemblée au cours de nombreuses années de recherche, qui réunit aujourd’hui sur différents supports 160 000 documents iconographiques ayant trait à l’architecture et aux arts visuels de la période romane. Sont consultables en accès libre environ 16 000 documents depuis janvier 2013. La grande richesse de cette base consacrée à l’architecture et l’art médiéval est, outre son aspect spécialisé, son indexation selon un thésaurus hiérarchisé. Ce thésaurus a été établi sur la base du Thesaurus Exemplorum Medii Aevi (THEMA) élaboré par le Groupe d’Anthropologie Historique de l’Occident Médiéval (GAHOM) , mais enrichi pour les données architecturales, ce qui a donné lieu au Thésaurus des images médiévales en ligne (TIMEL). Romane est une base documentaire, mais aussi de recherche, dans la mesure où nombre d’informations inédites y sont publiées au fur et à mesure de l’établissement des notices. La possibilité, à partir d’une recherche iconographique sur la base, d’exporter les images sous forme de diaporama ou de planche contact facilite également son utilisation pédagogique. Les outils de géolocalisation (via Google Maps) permettent par ailleurs de considérer les monuments dans leur contexte urbain (via Google Street View).

Pour des raisons de droit de diffusion des images, certaines notices ne sont pas en libre accès, et ne sont consultables que sur place, au CESCM à Poitiers. C’est notamment le cas des notices réalisées à partir de bâtiments ou d’objets faisant partie de collections particulières. De manière générale, la base Romane se refuse désormais à accepter les dons de photos sans droits d’usage ou les documents de mauvaise qualité : trop de problèmes ont été rencontrés par le passé au cours de programmes de numérisation pour qu’ils ne soient pas prévenus désormais en amont, et les acquisitions comme les nouvelles campagnes de photographie sont aujourd’hui rigoureusement encadrées, tant juridiquement que scientifiquement.

La structure informatique de la base a été créée sur mesure pour répondre aux besoins spécifiques des chercheurs du CESCM, tant en termes de fonctionnalités que de structuration de l’information scientifique (topographie, architecture, mobilier/objet, iconographie). Dans cette base, les images sont indexées au même titre que les objets (architecturaux, mobiliers…) auxquelles elles correspondent, ce qui permet de gérer les problèmes de droit ou simplement d’identité des documents iconographiques en même temps que les informations à proprement parler scientifiques auxquels ces documents sont attachés.

Les bibliothèques iconographiques du CESR

Les programmes de numérisation au CESR ont été mis en place, comme pour le CESCM, à partir de collections diverses rassemblées au sein d’un même laboratoire de recherche par des chercheurs venus de différents horizons. Tout programme de numérisation suppose un workflow bien défini en fonction des objectifs du programme, dont les étapes sont : 1/ la numérisation à proprement parler, 2/ l’archivage, 3/ le traitement, 4/ l’exploitation et la diffusion des documents, enfin l’indexation, qui peut prendre place à un moment ou un autre du workflow. Chaque étape pose ses problèmes de volumétrie, de protocole, de résolution, de délocalisation de sauvegarde, etc., chacune devant être contrôlée avant le passage à l’étape suivante.

Le CESR, après un tâtonnement dû à un marché et des solutions techniques encore en pleine gestation, a opté pour la création d’un certain nombre de bibliothèques numériques qui permettent de pérenniser les fonds iconographiques en les archivant. Ces différentes numérisations ont été rassemblées en différents portails thématiques (Architectura pour l’architecture, Bibliothèques virtuelles humanistes pour la littérature, Ricercar pour la musique) afin de rendre visibles et facilement interrogeables ces corpus.

La structuration du portail des BVH permet d’articuler les livres (avec informations bibliographiques), les pages (qui permet d’associer à tel livre un ensemble d’images) et le contenu de ces pages (textes ou images). Le programme des BVH a permis de développer, avec l’aide du Laboratoire d’Informatique (LI) de l’université de Tours, AGORA, un outil de reconnaissance des formes et analyse d’images (RFAI) dont le but initial a été de faciliter l’OCR des textes numérisés en débarrassant l’analyse informatique des pages des lettrines, bandeaux et autres éléments iconographiques. Paradoxalement, cela a permis d’identifier ces éléments dans les pages, et de les traiter dans des bases indépendantes, réunies dans la Base de typographie de la Renaissance (BATYR). Ces éléments sont indexés à l’aide du thésaurus international IconClass, dont les défauts – notamment son classement alphanumérique peu intuitif – sont en partie compensés par l’avantage du multilinguisme.