Partage et réutilisation des données de simulations de dynamique moléculaire : qu'avons-nous raté ?
4 décembre 2024Session 2 : Assurer les conditions de la réutilisabilité
Success stories réutilisation des données
- Partage et réutilisation des données de simulations de dynamique moléculaire : qu'avons-nous raté ? - Pierre Poulain (Université Paris Cité et CNRS)
Résumé : Les besoins de reproductibilité et l'essor de la science ouverte ont conduit au partage et au stockage des données de la recherche dans de multiples entrepôts de données. En biologie, certaines communautés bien organisées (notamment en génomique) disposent d'entrepôts de données spécialisés et réputés, mais ceci n'est pas le cas partout. Ainsi, l'absence d'entrepôt de données dédié aux simulations de dynamique moléculaire a conduit à l'accumulation de fichiers de simulation dans des entrepôts généralistes, constituant ce que nous appelons la « matière noire » de la dynamique moléculaire : des données techniquement accessibles, mais ni indexées, ni annotées, ni facilement réutilisables. Avec le projet MDverse, nous avons répertorié plusieurs centaines de milliers de fichiers de dynamique moléculaire. À partir de quelques exemples, nous illustrerons le potentiel offert par ces données. Nous soulignerons également le rôle crucial joué par les métadonnées. Enfin, nous discuterons des stratégies possibles pour créer des métadonnées lorsqu'elles n'existent pas, afin de favoriser la réutilisation des données de dynamique moléculaire.
Mots clés : cite cnrs days donnees dynamique gricad moleculaire open paris partage pierre poulain reutilisation science simulation uga universite
Informations
- Gricad Vidéos
- 8 janvier 2025 14:52
- Conférences
- Français
Commentaire(s)