De nos jours, les acteurs des SHS en général et les institutions culturelles en particulier, peuvent gérer des données et connaissances sous différents formats : documents textuels, documents structurés, bases de données, base de connaissances, images, représentation 3D, etc. De plus, ces données peuvent être distribuées sur plusieurs sites ou non, voir ouvertes et liées (open data).
Pour pouvoir accéder à ses informations, ou, voire plus, mettre en lien ses données avec celles d’un partenaire, un acteur doit mettre en place des systèmes d’information complexes qui soulèvent des réelles questionnements car il faut prendre en considération la variété des données : sources, contenu, type de documents, mais aussi leur disponibilité, leur sémantique et leur stockage.
De plus, une fois l’accès aux données mis en place, que peuvent-elles nous dire, quelles sont les connaissances qu’elles pourront apporter aux différentes institutions ? Cette question pratique soulève des nombreux défis : comment identifier et extraire les connaissances des données disponibles ? Quelle sémantique leur accorder ? Comment rendre ces connaissances disponibles et compréhensibles par les institutions ? Il y a-t-il des problèmes liés à la protection de la vie privée des individus, des objets ?
Le groupe de travail DAHLIA se propose de créer un écosystème interdisciplinaire permettant de traiter ces différents défis et lever certains verrous scientifiques. A cette fin, dans le GT DAHLIA les axes suivants seront traités :