Séminaires des données de la recherche (Séance 4) : Structurer les données de la recherche

GERiiCO Séminaire données de la recherche
Salle A1.633, Bâtiment A, campus Pont-de-Bois, Université de Lille, Villeneuve d'Ascq

Titre : Structurer les données de la recherche

Intervenant (s)

Résumé : Afin de faciliter les échanges d'information, il est nécessaire d'utiliser un langage commun pour structurer les données. On parle alors de standards de métadonnées (metadata standard). Il existe différents types de standards de métadonnées : génériques, disciplinaires et technologiques. Nous étudierons le standard Dublin Core défini pour décrire de façon synthétique tout type de contenu et notamment les corpus de textes, les images et les enquêtes.

Nous présenterons le langage XML qui est un langage de balises permettant de décrire et structurer les données de la recherche. Après avoir détaillé quelques exemples de jeux de données structurés dans ce langage, des exercices permettront de mettre en pratique le langage XML et le standard Dublin Core sur des jeux de données de tests.

Nous aborderons les formats descriptifs notamment à travers des exemples de structuration de données, et nous montrerons comment baliser les données. Un TD sera mené sur trois types de données : corpus de textes, d'images, d'enquêtes.

Contact (s) : Joachim Schöpfel, Bernard Jacquemin, Eric Kergosien

Pour plus d’informations sur la thématique globale du cycle de séminaires, et par les autres évènements associés, cliquez ici.


Partager sur X Partager sur Facebook