31
Natalie Clairoux, M. Sc., M.S.I. Bibliothécaire Ateliers pour chercheurs futés 22 mai 2014 INTRODUCTION À LA GESTION DES DONNÉES DE RECHERCHE

Introduction à la gestion des données de recherche

Embed Size (px)

DESCRIPTION

Traduction et adaptation du Module 1 du New England Collaborative Data Management Curriculum. Définition et cycles des données de recherche, plan de gestion des données de recherche, enjeux à considérer, préservation, soutien de la bibliothèque.

Citation preview

Page 1: Introduction à la gestion des données de recherche

Natalie Clairoux, M. Sc., M.S.I.Bibliothécaire

Ateliers pour chercheurs futés

22 mai 2014

INTRODUCTION À LA GESTION DES DONNÉES DE RECHERCHE

Page 2: Introduction à la gestion des données de recherche

Mention de source

Le contenu de cette présentation est une traduction et une adaptation de documents provenant du New England Collaborative Data Management Curriculum.

Ce cours a été développé par la bibliothèque Lamar Soutter, University of Massachusetts Medical School: http://library.umassmed.edu/necdmc

Natalie Clairoux Introduction à la gestion des données de rechercheÉté 2014

Page 3: Introduction à la gestion des données de recherche

Objectifs d’apprentissage

1. Reconnaître ce que sont des données de recherche et ce que la gestion des données implique

2. Comprendre pourquoi la gestion des données est importante pour votre carrière en recherche

3. Identifier les enjeux liés à la gestion des données de recherche

4. Apprendre les bonnes pratiques et identifier les ressources pertinentes à la gestion des données

Natalie Clairoux Introduction à la gestion des données de rechercheÉté 2014

Page 4: Introduction à la gestion des données de recherche

LES TYPES ET LE CYCLE DES DONNÉES DE RECHERCHE

LE PLAN DE GESTION DES DONNÉES ET SES PRINCIPAUX ENJEUX

LA PRÉSERVATION DES DONNÉES

LE SOUTIEN OFFERT PAR LA BIBLIOTHÈQUE

Natalie Clairoux Introduction à la gestion des données de rechercheÉté 2014

Page 5: Introduction à la gestion des données de recherche

Définitions : données de recherche

“Research data, unlike other types of information, is collected, observed, or created, for purposes of analysis to produce original research results” (University of Edinburgh).

“The recorded factual material commonly accepted in the research community as necessary to validate research findings” (Extrait de OMB Circular A-110 36.d.2.i).

Natalie Clairoux Introduction à la gestion des données de rechercheÉté 2014

Page 6: Introduction à la gestion des données de recherche

Types de données de recherche

1. Observation

2. Expérimentales

3. Simulation

4. Dérivées ou compilation

Natalie Clairoux Introduction à la gestion des données de rechercheÉté 2014

Image: Jørgen Stamp, Digitalbevaring.dk

Page 7: Introduction à la gestion des données de recherche

Le cycle des données de recherche

Natalie Clairoux Introduction à la gestion des données de rechercheÉté 2014

Création

Traitement

Analyse

Préservation

Partage

Réutilisation

Page 8: Introduction à la gestion des données de recherche

Quelques arguments pour la saine gestion de vos données de recherche

1. Transparence et intégrité

2. Conformité

3. Bénéfices personnels

4. Pour la science en elle-même:

Natalie Clairoux Introduction à la gestion des données de rechercheÉté 2014

“Data is the currency of science, even if publications are still the currency of tenure. To be able to exchange data, communicate it, mine it, reuse it, and review it is essential to scientific productivity, collaboration, and to discovery itself” (Gold, 2007).

Page 9: Introduction à la gestion des données de recherche

Et éventuellement… par obligation?

Plusieurs consultations récentes ont porté sur la question des avantages potentiels du partage des données au Canada, et d’autres sont en cours.

Les détenteurs d’une subvention des IRSC doivent conserver les ensembles de données originaux découlant de la recherche financée par les IRSC pendant au moins cinq ans après la fin de la subvention.

Aux États-Unis, les récentes mises à jour des politiques du NIH et la NSF incluent le dépôt d’un plan de gestion des données de recherche.

Natalie Clairoux Introduction à la gestion des données de rechercheÉté 2014

Page 10: Introduction à la gestion des données de recherche

Quelques mythes sur le partage des données...

Toutes les données n’ont pas nécessairement à être partagées.

Le partage peut prendre plusieurs formes.

Les organismes subventionnaires reconnaissent que différentes disciplines possèdent des cultures différentes quant au partage de données.

Le partage devrait se faire à un coût et dans un intervalle de temps raisonnables.

Pas un mythe, mais une réalité: le partage augmente le nombre de citations!

Source: Lisa Federer, Data 101 - An Introduction to Research Data Management

Natalie Clairoux Introduction à la gestion des données de rechercheÉté 2014

Page 11: Introduction à la gestion des données de recherche

Natalie Clairoux Introduction à la gestion des données de rechercheÉté 2014

LES TYPES ET LE CYCLE DES DONNÉES DE RECHERCHE

LE PLAN DE GESTION DES DONNÉES ET SES PRINCIPAUX ENJEUX

LA PRÉSERVATION DES DONNÉES

LE SOUTIEN OFFERT PAR LA BIBLIOTHÈQUE

Page 12: Introduction à la gestion des données de recherche

Plan de gestion des données: 7 étapes à considérer

Natalie Clairoux Introduction à la gestion des données de rechercheÉté 2014

1. Types de données produites

2. Détails contextuels (métadonnées) nécessaires pour rendre les données utiles aux autres chercheurs

3. Stockage, copie de secours et sécurité

4. Précautions pour la propriété intellectuelle / vie privée

5. Politiques pour la réutilisation

6. Politiques pour l’accès et le partage

7. Plan pour l’archivage et la préservation de l’accès

Image: Jørgen Stamp, Digitalbevaring.dk

Page 13: Introduction à la gestion des données de recherche

Exemple d’un plan de gestion des données

Natalie Clairoux Introduction à la gestion des données de rechercheÉté 2014

Source: Example Data Management Plan: Biology (2)

Page 14: Introduction à la gestion des données de recherche

Enjeu 1 de la planification de la gestion des données: la responsabilité

Natalie Clairoux Introduction à la gestion des données de rechercheÉté 2014

À considérer: Équipes multidiciplinaires, gestion des cahiers de laboratoire, rotation du personnel de laboratoire...

Bonnes pratiques1. Définir les rôles de chacun et assigner les responsabilités pour la

gestion des données

2. Pour chaque tâche identifiée dans le plan, identifier les compétences requises

3. Associer les compétences au personnel disponible et identifier les brèches

4. Assurer la continuité par le biais de formations

5. Désigner des responsables et surveiller les résultats

Page 15: Introduction à la gestion des données de recherche

Enjeu 2 de la planification de la gestion des données: la gestion des résultats

Natalie Clairoux Introduction à la gestion des données de rechercheÉté 2014

Sou

rce:

Jen

Fer

guso

n, 2

013

Page 16: Introduction à la gestion des données de recherche

Natalie Clairoux Introduction à la gestion des données de rechercheÉté 2014

À considérer: Pas de règles pour nommer des fichiers… en plusieurs versions… dans des dossiers classés au petit bonheur…stockés sur des médias variés… conservés dans plusieurs endroits… et en plusieurs formats!

Bonnes pratiques1. Créer des règles pour nommer les fichiers

2. Créer une classification pour les dossiers de fichiers

3. Créer une codification pour les versions

4. Choisir des formats de fichiers appropriés pour la préservation et le partage des données

Enjeu 2 de la planification de la gestion des données: la gestion des résultats

Page 17: Introduction à la gestion des données de recherche

Natalie Clairoux Introduction à la gestion des données de rechercheÉté 2014

Enjeu 3 de la planification de la gestion des données: les métadonnées

Page 18: Introduction à la gestion des données de recherche

Natalie Clairoux Introduction à la gestion des données de rechercheÉté 2014

À considérer: Les gens comprendront-ils vos données? Quelles normes pourriez-vous utiliser pour étiqueter vos données? Comment décrire votre ensemble de données pour qu’il soit repérable?

Bonnes pratiques1. Décrire le contenu des fichiers de données (exemples de normes:

Dublin Core, MIAME, Protocol Data Element Definitions)

2. Définir les paramètres et les unités de mesure

3. Créer un dictionnaire de données

4. Définir les valeurs codées et les données manquantes

5. Un outil en accès libre pour créer des métadonnées: DataUp

Enjeu 3 de la planification de la gestion des données: les métadonnées

Page 19: Introduction à la gestion des données de recherche

Natalie Clairoux Introduction à la gestion des données de rechercheÉté 2014

À considérer: À quelle fréquence? En combien de copies? À quell endroit? Combien d’espace sera requis sur le serveur?

Bonnes pratiques1. Trois copies (originale, externe/locale et externe/à distance)

2. Distribution géographique des copies

3. Copiez sur un disque dur externe (Mac Timeline, UNIX rsync)

4. Profitez de l’entreposage sur le nuage (Amazon 3S, Elephant Drive, Jungle Disk, Mozy, Carbonite...)

5. Données encryptées (sujets humains): garder 2 copies des mots de passe et clés de codage

Enjeu 4 de la planification de la gestion des données: la sauvegarde

Page 20: Introduction à la gestion des données de recherche

Natalie Clairoux Introduction à la gestion des données de rechercheÉté 2014

Enjeu 5 de la planification de la gestion des données: propriété et rétention

Page 21: Introduction à la gestion des données de recherche

Natalie Clairoux Introduction à la gestion des données de rechercheÉté 2014

À considérer: Qui détient la propriété intellectuelle? Combien de temps doit-on conserver les données?

Bonnes pratiques1. S’assurer que la personne qui a produit les données se porte

garante de leur préservation

2. Vérifier les politiques de votre organisme subventionnaire et/ou de l’éditeur de votre article

3. Consulter les politiques de l’UdeM sur la gestion des bases de données et sur la probité intellectuelle; voir le calendrier de conservation des documents

4. Les données servant à soutenir un brevet doivent être conservées indéfiniment

Enjeu 5 de la planification de la gestion des données: propriété et rétention

Page 22: Introduction à la gestion des données de recherche

Natalie Clairoux Introduction à la gestion des données de rechercheÉté 2014

LES TYPES ET LE CYCLE DES DONNÉES DE RECHERCHE

LE PLAN DE GESTION DES DONNÉES ET SES PRINCIPAUX ENJEUX

LA PRÉSERVATION DES DONNÉES

LE SOUTIEN OFFERT PAR LA BIBLIOTHÈQUE

Page 23: Introduction à la gestion des données de recherche

Planification à long terme

Natalie Clairoux Introduction à la gestion des données de rechercheÉté 2014

Qu’arrivera-t-il aux données lorsque le projet sera terminé?

Comment évaluer la valeur de mes données?

Quelles sont les options pour l’archivage et la préservation de mes données?

Quelles sont mes options pour publier et partager mes données?

Image: Jørgen Stamp, Digitalbevaring.dk

Page 24: Introduction à la gestion des données de recherche

Format de fichier ouvert vs propriétaire

Natalie Clairoux Introduction à la gestion des données de rechercheÉté 2014

Un logiciel particulier doit-il être utilisé pour lire et travailler avec le fichier de données? Si oui, le logiciel, sa version et le système d’exploitation requis devraient être mentionnés dans les métadonnées.

Est-ce que plusieurs fichiers composent la structure des fichiers de données? Si oui, le mentionner dans les métadonnées.

Lors de la sélection du format de fichiers, prioriser un format constant pouvant être lu dans le futur et indépendamment de modifications dans l’application.

Fichiers ouverts: standard documenté, non-encrypté, non-compressé, en format ASCII. Sera lisible dans le futur!

Page 25: Introduction à la gestion des données de recherche

Déposer et publier des ensembles de données

Natalie Clairoux Introduction à la gestion des données de rechercheÉté 2014

Le Centre d'expertise numérique pour la recherche (CEN-R) peut vous conseiller pour la structuration de vos données.

Databib vous propose plus de 500 dépôts de données de recherche. Le Registry of Research Data Repositories tient lui aussi une liste détaillée, de même que le NIH et l’OAD.

Plusieurs organismes dont DMP Online vous permettent d'élaborer un plan de gestion des données.

Accédez au portail du NCBI pour y déposer vos données.

Nouvelle revue chez Nature Publishing Group: Scientific Data

Page 26: Introduction à la gestion des données de recherche

Impact de votre recherche au-delà des publications

Natalie Clairoux Introduction à la gestion des données de rechercheÉté 2014

La création d’un doi ou d’un lien permanent maximise la découverte de vos données et permet de mesurer son impact

Partage de vos données compilé dans certains outils d’altmetrics, tels que ImpactStory (Figshare, Github)

Page 27: Introduction à la gestion des données de recherche

Natalie Clairoux Introduction à la gestion des données de rechercheÉté 2014

LES TYPES ET LE CYCLE DES DONNÉES DE RECHERCHE

LE PLAN DE GESTION DES DONNÉES ET SES PRINCIPAUX ENJEUX

LA PRÉSERVATION DES DONNÉES

LE SOUTIEN OFFERT PAR LA BIBLIOTHÈQUE

Page 28: Introduction à la gestion des données de recherche

Infrastructures… à venir?!

« Pour pallier l’absence d’infrastructure au Canada, l’ABRC propose d’élaborer un réseau national de dépôts pour recueillir les données de recherche, en collaboration avec d’autres partenaires. »

« La vision de ce projet consiste à développer des dépôts de données dans les universités du Canada, où les chercheurs pourraient verser leurs données et les lier à des dépôts disciplinaires, de sorte que les données puissent être intégrées et réutilisées d’une nouvelle façon. »

Source: Science.gc.ca

Plus d’info: Sous-comité de l’ABRC sur la gestion des données

Natalie Clairoux Introduction à la gestion des données de rechercheÉté 2014

Page 29: Introduction à la gestion des données de recherche

Soutien aux chercheurs à la bibliothèque

Trouver des ensembles de données pour utilisation dans votre recherche

Comment citer les données publiées par quelqu’un d’autre

Vous aider à écrire un plan de gestion des données de recherche

Natalie Clairoux Introduction à la gestion des données de rechercheÉté 2014

Image: Jørgen Stamp, Digitalbevaring.dk

Page 30: Introduction à la gestion des données de recherche

Formation pour chercheurs et étudiants

Traduction et adaptation du NEDMC (6 modules) pour intégration dans un cours?

Guide sur la gestion des données de recherche – été 2014

Natalie Clairoux Introduction à la gestion des données de rechercheÉté 2014

Image: Jørgen Stamp, Digitalbevaring.dk

Page 31: Introduction à la gestion des données de recherche

Merci! Des questions?

Natalie Clairoux Introduction à la gestion des données de rechercheÉté 2014

Maintenant que vous connaissez les bases de la gestion des données de recherche... vous éviterez bien des situations de ce genre!

Source: NYU Health Sciences Library