Séminaire données de la recherche (Séance 3) : Décrire les données de la recherche

Séminaire données de la recherche

Le Plan national pour la science ouverte préconise l’ouverture et la structuration des données de recherche. Il recommande également la formation des doctorants aux bonnes pratiques de la gestion des données.

Problématique du séminaire 

 

Le Plan national pour la science ouverte préconise l’ouverture et la structuration des données de recherche. Il recommande également la formation des doctorants aux bonnes pratiques de la gestion des données. A partir de l’AAPG 2020, l’ANR rend obligatoire la rédaction d’un plan de gestion de données pour chaque projet retenu. Pour ces trois raisons, il est nécessaire de former les doctorants à la gestion des données de recherche, à partir de leurs propres données et avec le modèle du plan de gestion de l’ANR sur la plateforme DMP OPIDoR du CNRS. L’originalité du séminaire est l’approche scientifique et disciplinaire, dans une démarche de bottom-up, à partir de l’expérience et des compétences de la communauté scientifique des SHS (data community) et avec des formateurs scientifiques.

Le séminaire a lieu dans les locaux de la BU sciences humaines et sociales (Pont de Bois).

Séance 3 :

La description des données est une étape primordiale dans le plan de gestion. En effet, afin que les données de la recherche soient réutilisables, le contexte de leur production doit être documenté de manière précise et intelligible. Ainsi, il peut être décrit par :

- Une documentation adéquate, sous la forme d'un fichier txt ou pdf qui rapporte des informations sur le projet (hypothèses, méthodologie, échantillonnage, instruments ...), sur les fichiers ou la base de données et sur les paramètres ;

- Et des métadonnées (metadata) : ensemble sDtructuré de données qui servent à définir ou décrire une ressource quel que soit son support. Les métadonnées répondent aux questions suivantes : qui, quoi, où, quand, comment, pourquoi ? Avec les métadonnées, le fournisseur de données apporte aux utilisateurs des informations sur le contexte de production et la qualité de ses données, tandis que l'utilisateur peut découvrir des ressources et évaluer leur pertinence par rapport à ses besoins.

Nous profiterons de cette séance pour traiter les règles de nommage des documents, la notion d’identifiant pérenne pour les données de la recherche et la façon de lier vos données aux publications scientifiques résultantes des travaux scientifiques.

Formateur(s): E.Kergosien, B.Jacquemin 

Lien vers la formation complète