Huma-Num Box

La TGIR Huma-Num propose un dispositif de stockage distribué en réseau (via RENATER) à destination de ses structures partenaires dont la MSH Val de Loire. Celui-ci vise à faciliter pour les chercheurs le stockage, la sécurisation et la gestion des jeux de données volumineux.

Le dispositif est indépendant des systèmes et services existants à ce jour au sein d’Huma-Num (Sharedocs, Nakala, Nakalona, hébergement Web, iRods).  Il offre un nouveau service complémentaire pour accueillir des jeux de données, principalement de grandes tailles (plusieurs centaines de To au total). Ce dispositif est une infrastructure technique, indépendante des usages fonctionnels (au sens des données : usage, référencement, traitement, publication, …) et des usages métier. Il est à considérer comme un équivalent technique d’un serveur de fichiers ordinaire, avec des fonctionnalités supplémentaires de préservation.

Les données candidates à ce dispositif sont réputées « tièdes » voire « froides », au sens où peu d’accès en écriture comme en lecture seront effectués durant toute la vie de ces données avec également très peu d’accès concurrents. Par contre ces données ont vocation à être conservées de manière fiable durant plusieurs années (5 à 10 ans), car elles constituent la matière première du travail des chercheurs et ont souvent une valeur de type patrimonial.
Le service de stockage peut être vu comme le pendant numérique d’une armoire sécurisée où l’on stocke des documents importants, à la différence d’un bureau où se trouvent les documents courants et de toutes natures.

Ces données seront notamment issues de campagnes de numérisation de fonds anciens, de photos, d’enregistrements audio, de cartes, de vidéos, de modèles 3D. Elles seront uniquement sous la forme de fichiers, si possible de grande taille, éventuellement accompagnés de fichiers de méta-données techniques et documentaires librement produits par les utilisateurs. Le dispositif lui-même ne gère pas l’association des méta-données et des données, c’est à l’utilisateur de le prendre en charge. Les données stockées ne pourront pas être sous forme de bases de données au sens informatique. Leur volume pourra atteindre plusieurs To par jeu de données.

Les données seront organisées en « partages » (ou en « volumes »), disposant de règles d’accès comme celles utilisées sur des services de fichiers classiques. Chaque équipe de recherche intéressée par ce service sera sollicitée pour désigner un gestionnaire de ces partages qui définira librement l’organisation arborescente des fichiers contenus dans chaque partage, afin de répondre au plan de classement défini par chaque équipe.

L’intérêt principal de la Huma-Num Box est qu’elle permet, en plus du stockage sécurisé dans la “Box” localisée au DataCenter de l’université de Tours, de dupliquer les données dans les différentes structures adoptant ce dispositif dans le respect des intérêts scientifiques des enseignants/chercheurs.

Pour vous conseiller ou vous orienter sur des recherches spécifiques vous pouvez contacter Alain Ravaz.