Rdiger et publier un data paper dans une revue scientifique

  • Published on
    26-Dec-2014

  • View
    156

  • Download
    1

DESCRIPTION

Le data paper est une publication qui dcrit un jeu de donnes scientifiques brutes (data, dataset), notamment laide dinformations prcises, appeles mtadonnes (metadata). Il a pour objectif dinformer la communaut scientifique de lexistence et de la disponibilit dun jeu de donnes qui est dpos dans un entrept de donnes et auquel cet entrept a attribu un identifiant prenne (Digital Objet identifier - DOI). Auteur : Dedieu Laurence, Cirad Source : site CoopIST, Cirad (http://coop-ist.cirad.fr/)

Transcript

  • 1. Titre : Rdiger et publier un data paper http://coop-ist.cirad.fr Public cible : chercheurs Rdiger et publier un data paper dans une revue scientifique en 5 points 1. Quest-ce quun data paper ? 2. Pourquoi publier un data paper ? 3. Comment structurer un data paper ? 4. Exemples de structure de data papers en sciences du vivant 5. Liens utiles : exemples et guides 1 1. Quest-ce quun data paper ? Le data paper est une publication qui dcrit un jeu de donnes scientifiques brutes (data, dataset), notamment laide dinformations prcises, appeles mtadonnes (metadata). Les donnes dcrites doivent tre accessibles, soit sous forme de fichiers annexs, soit plus gnralement par un lien prenne (URL, DOI) vers lentrept de donnes en ligne (data repository, ou repository of research data) o elles sont dposes et correctement formates. Les mtadonnes dtaillent pourquoi, par qui et comment ces donnes ont t collectes, qui en est propritaire, sous quel format elles sont stockes, etc. Le data paper est publi sous la forme d'un article examin par les pairs dans une revue scientifique classique publiant diffrentes formes darticles dont des data papers ou dans un data journal, cest--dire une revue contenant exclusivement des data papers. Le data paper informe la communaut scientifique de la disponibilit de ces jeux de donnes et de leur potentiel pour des utilisations futures. Contrairement un article de recherche classique, le data paper dcrit uniquement des donnes scientifiques et les circonstances et mthodes de leur collecte. Il ne rend pas compte des hypothses ni des conclusions issues de lanalyse de ces donnes. Nanmoins, il prsente les analyses techniques et statistiques validant la qualit des donnes. Le data paper montre loriginalit et la porte du jeu de donnes quil dcrit. Les revues qui publient des data papers sintressent particulirement la porte des donnes soumises, cest--dire leur potentiel de rutilisation par dautres scientifiques. Il sagit l de largument majeur pour convaincre le rdacteur en chef daccepter votre data paper. 2. Pourquoi publier un data paper ? Le datapaper a pour objectif dinformer la communaut scientifique de lexistence et de la disponibilit dun jeu de donnes qui est dpos dans un entrept de donnes et auquel cet entrept a attribu un identifiant prenne (Digital Objet identifier (DOI). Il valorise les donnes en exposant leur potentiel pour des utilisations et projets futurs.
  • 2. Titre : Rdiger et publier un data paper http://coop-ist.cirad.fr Public cible : chercheurs Il facilite la rutilisation des donnes en mettant en vidence la qualit des donnes et des procdures, ainsi que la rigueur scientifique de ltude. Il apporte de la visibilit aux donnes, les rend plus facilement reprables et citables par dautres tudes. Le data paper est une publication citable, au mme titre que tout article scientifique publi, qui met en valeur son (ses) auteur(s) en tant que crateur(s) de donnes. Il permet la traabilit des citations et des rutilisations. 3. Comment structurer un data paper ? La structure du data paper est particulire. Elle varie nanmoins selon les revues scientifiques, entre une structure simple et une structure plus labore et dtaille. Lisez attentivement les instructions aux auteurs de la revue cible qui, parfois, proposent aussi des modles de fichiers, de prsentation ou dorganisation (templates, tool kit). La caractristique du data paper est quil est li au jeu de donnes brutes quil dcrit. Dans ce but, le jeu de donnes est dpos dans un entrept de donnes, au pralable ou au moment de la soumission de larticle. Lidentifiant prenne du jeu de donnes est indiqu dans le data paper. Laccessibilit des donnes est vrifie par les pairs lors de la rvision du manuscrit (peer-reviewing). La plupart des revues prconisent des entrepts de donnes quelles jugent de confiance, en termes de prennit notamment. Ces entrepts sont gnralement lists dans les instructions aux auteurs, en fonction du type de donnes (gntique, biodiversit, cologie, goscience, sciences humaines et sociales, etc.). Certaines revues disposent aussi de leur propre entrept de donnes. Le data paper comprend deux parties : lensemble des fichiers des donnes (data files) accessibles directement ou via un entrept de donnes. Ces donnes sont en libre accs ou en restriction daccs temporaire ; la partie descriptive, cest le data paper proprement dit. Cette partie explique le contexte dobtention des donnes, les prsente et en dmontre la fiabilit. La partie descriptive comprend en gnral les lments suivants : page de titre avec les noms et affiliations des auteurs, rsum, parfois des mots-cls, introduction prsentant larrire-plan de ltude (contexte et enjeu gnraux et spcifiques), les questions de recherche lorigine de la collecte des donnes, et la plus-value de cette collecte (originalit, importance et potentiel dutilisation en recherche), description suffisante des matriels et mthodes pour permettre de reproduire ltude : protocole exprimental, mthode dchantillonnage, descripteurs physiques, procdures de contrle qualit description suffisante des donnes pour permettre de les rutiliser : structure, format, disponibilit, explication de donnes aberrantes information et discussion justifiant la fiabilit et la rigueur des donnes, si besoin accompagnes de figures et tableaux : validation de la procdure de collecte de donnes, analyses statistiques de l'erreur exprimentale, valuation d'chantillons biologiques... 2
  • 3. Titre : Rdiger et publier un data paper http://coop-ist.cirad.fr Public cible : chercheurs si besoin, conseils pour la rutilisation des donnes, remerciements, contributions des auteurs, mention dventuels conflits dintrt, liste des rfrences bibliographiques, figures, tableaux, annexes, relatifs la mthodologie, la qualit des donnes, ou proposant une synthse des donnes. 4. Exemples de structure de data papers en sciences du vivant Les data papers sont une forme nouvelle de publication qui se dveloppe dans un objectif douverture des donnes, cest dire pour quelles soient accessibles librement et gratuitement. Cela explique quen 2014, les revues scientifiques publiant des data papers sont encore peu nombreuses. Nous proposons ci-dessous quatre exemples dcrivant le corps de data papers publis dans des revues dans les thmes de lcologie, la biodiversit, la gnomique, et les sciences de la vie. 4.1. Ecology et Ecological Archives (Ecological Society of America, ESA) Ecology (http://www.esajournals.org/loi/ecol), cre en 1920, est une revue sur abonnement mais qui autorise un libre accs aux articles aprs une priode dembargo de 2 ans. Elle publie diffrents types darticles, dont des data papers depuis lanne 2000 (rubrique Data papers), qui sont en libre accs total. Plus prcisment, Ecology publie le rsum et donne le lien vers la version complte du data paper (contenant les donnes et mtadonnes) qui est publie dans Ecological Archives (http://esapubs.org/archive/default.htm). Ecological Archives a t cr par lESA pour publier les data papers et tout matriel complmentaire aux articles publis dans ses revues. Dans ce cas, le data paper donne un accs direct chaque jeu de donnes, stock dans Ecological Archives et identifi par un lien URL. Les instructions aux auteurs sont disponibles : http://esapubs.org/archive/instruct_d.htm. Le corps du data paper comprend les sections suivantes : Introduction : contexte, question de recherche et objectifs de ltude, section Metadata qui rassemble les lments suivants : o Data set descriptors, Data structural descriptors et Data set status and accessibility : description du jeu de donnes, du format des fichiers, du statut, de la qualit et de laccessibilit aux donnes (libre, restrictions daccs, cot), o Research origin descriptors : contexte de ltude, mthodes et procdures. En 2014, le cot de publication dun data paper dans Ecology/Ecological Archives est de 250 $. Si la taille des fichiers dpasse 10 MB (formats plain text, .txt, .csv), un cot supplmentaire est d. 4.2. Biodiversity Data Journal (Pensoft Publishers) Biodiversity Data Journal (http://biodiversitydatajournal.com/), cre en 2013, est lune des 14 revues en libre accs total publies par Pensoft. Toutes ces revues publient diffrentes formes darticles dont des data papers. 3
  • 4. Titre : Rdiger et publier un data paper http://coop-ist.cirad.fr Public cible : chercheurs Biodiversity Data Journal publie des data papers dcrivant des donnes dans le domaine de la biodiversit, incluant cologie et environnement. Les petits jeux de donnes peuvent tre accessibles directement sur le site de la revue sous forme de fichiers supplmentaires. Les jeux volumineux sont dposs dans un entrept de donnes (liste des entrepts recommands fournie dans les instructions aux auteurs). Les instructions aux auteurs sont disponibles : http://biodiversitydatajournal.com/about#Datapublication. Le corps du data paper comprend les sections suivantes : Introduction : contexte, question de recherche et objectifs de ltude, Metadata, renseignes selon le GBIF Metadata Profile elements : o Taxonomic Coverage, Spatial Coverage, Temporal Coverage, o Project Description: title of the project, personnel involved, funding sources, Study area 4 description, and design description, o Methods: method step, Sampling, quality control, o Dataset Descriptions: Object name, character encoding, format name and version, distribution/online/URL, publication date, language, and intellectual rights. Pour faciliter la rdaction du data paper et la publication des donnes, lditeur propose aux auteurs de se connecter la plateforme logicielle Integrated Publishing Toolkit (IPT, http://www.gbif.org/ipt) qui gre trois types de donnes : les donnes primaires, les checklists et les mtadonnes. Les donnes sont publies sous format Darwin Core Archives et Ecological Modeling Language. A la date de rdaction de cette fiche (septembre 2014), cette revue ne demande pas de frais de publication aux auteurs. 4.3. Genomics Data (Elsevier) Genomics Data (http://www.journals.elsevier.com/genomics-data/) est une revue en libre accs total cre en 2013. Elle publie diffrentes types darticles dont des data papers (rubrique Data in Brief) dcrivant des donnes gntiques avec un lien vers lentrept o sont dposes les donnes. La liste des entrepts recommands est disponible : http://www.elsevier.com/about/content-innovation/ database-linking#supported-data-repositories. Les instructions aux auteurs et le modle (template) de data paper sont disponibles : http://www.elsevier.com/journals/genomics-data/2213-5960/guide-for-authors#2001. Le corps du data paper comprend les sections suivantes : tableau de Spcifications des donnes, section Experimental design, Materials and Methods, Discussion courte mettant en valeur la porte du jeu de donnes. En 2014, le cot de publication dun data paper dans Genomics Data est de 500 $. 4.4. Scientific Data (Nature Publishing Group) Scientific Data (http://www.nature.com/sdata/) est une revue en libre accs total cre en 2014. Elle publie uniquement des data papers (nomms Data Descriptors par la revue) dcrivant des jeux de
  • 5. Titre : Rdiger et publier un data paper http://coop-ist.cirad.fr Public cible : chercheurs donnes en sciences de la vie, environnement et biomdecine, avec un lien vers lentrept o ces donnes sont librement accessibles. La liste des entrepts recommands est disponible : http://www.nature.com/sdata/data-policies/repositories. Les instructions aux auteurs et les modles (templates) de data paper sont disponibles : http://www.nature.com/sdata/for-authors/submission-guidelines. Le corps du data paper comprend les sections suivantes: Background & Summary : contexte scientifique, question de recherche, objectifs de ltude, valeur et potentiel des donnes pour leur rutilisation, Methods : mthodes, procdures et analyses. Le protocole exprimental peut tre prsent sous forme de figure et les variables dans un tableau, Data Records : description des donnes et de lentrept o elles sont dposes, format des fichiers. La prsentation sous forme de tableaux est recommande, Metadata Records : mtadonnes prsentes dans des tableaux (modle fourni) : processus exprimental, mthode dchantillonnage, description du site, conditions dexpriences, protocoles suivis, donnes obtenues Technical Validation : explication de la rigueur scientifique de ltude et de la qualit technique des donnes, Usage Notes : facultatives, indications facilitant la rutilisation des donnes par dautres scientifiques. En 2014, le cot de publication dans Scientific Data est de 750 . Dans le cas o les donnes seraient dposes dans les entrepts gnralistes DRYAD (http://datadryad.org/) ou FigShare (http://figshare.com/), ce cot de publication inclut la possibilit de stocker 10 GB de donnes dans DRYAD ou 5 GB dans FigShare. 5. Liens utiles : exemples et guides 5.1. Exemples de revues publiant des data papers BMC Research Notes (BioMed Central) : http://www.biomedcentral.com/bmcresnotes/authors/instructions/datanote Earth System Science Data (Copernicus Publication) : http://earth-system-science-data.net/ Ecological Research (Springer) : http://www.springer.com/life+sciences/ecology/journal/11284 Ecology et Ecological Archives (Ecological Society of America) : http://www.esajournals.org/loi/ecol F1000Research (F1000) : http://f1000research.com/ Genomics Data (Elsevier) : http://www.journals.elsevier.com/genomics-data/ Geoscience Data Journal (Wiley) : http://onlinelibrary.wiley.com/journal/10.1002/(ISSN)2049-6060 Geoscientific Model Development (Copernicus Publication) : http://www.geoscientific-model-development. 5 net/ GigaScience (BioMed Central) : http://www.gigasciencejournal.com/about International Journal of Robotics Research (SAGE Publications): http://ijr.sagepub.com/ Journal of Chemical & Engineering Data (ACS Publications) : http://pubs.acs.org/journal/jceaax
  • 6. Titre : Rdiger et publier un data paper http://coop-ist.cirad.fr Public cible : chercheurs Journal of Open Archaeology Data (Ubiquity Press) : http://openarchaeologydata.metajnl.com/ Journal of Open Psychology Data (Ubiquity Press) : http://openpsychologydata.metajnl.com/ Journal of Open Health Data (Ubiquity Press) : http://openhealthdata.metajnl.com/ Journal of Open Research Software (Ubiquity Press) : http://openresearchsoftware.metajnl.com/ Journal of Physical and Chemical Reference Data (AIP Publishing) : http://scitation.aip.org/content/aip/journal/jpcrd Scientific Data (Nature Publishing Group) : http://www.nature.com/sdata/ Les 14 revues de Pensoft Publishers : http://www.pensoft.net/about.php 5.2. Guides pour la description des jeux de donnes et des mtadonnes Le data paper doit dcrire les mtadonnes (metadata), de telle faon que les donnes puissent tre rutilisables par tous. Or les auteurs sont souvent dmunis face la mise en forme de ces mtadonnes, indispensables pour publier larticle et aussi pour dposer les donnes dans un entrept. Ces guides aident la rdaction du data paper en expliquant les normes respecter pour les mtadonnes. Dans le domaine de la biodiversit : Penev L, Mietchen D, Chavan V, Hagedorn G, Remsen D, Smith V, Shotton D, 2011. Pensoft Data Publishing Policies and Guidelines for Biodiversity Data. Pensoft Publishers. http://www.pensoft.net/J_FILES/Pensoft_Data_Publishing_Policies_and_Guidelines.pdf Dans le domaine des informations gospatiales : http://www.ncddc.noaa.gov/metadata-standards/ Dans le domaine de lcologie : http://www.dcc.ac.uk/resources/metadata-standards/eml-ecological-metadata-language Dans le domaine des sciences humaines et sociales : Inter-university Consortium for Political and Social Research (ICPSR), 2012. Guide to Social Science Data Preparation and Archiving: Best Practice Throughout the Data Life Cycle (5th ed.). Ann Arbor, MI. ISBN 978-0-89138-800-5. http://www.icpsr.umich.edu/files/deposit/dataprep.pdf 6
  • 7. Titre : Rdiger et publier un data paper http://coop-ist.cirad.fr Public cible : chercheurs Information Comment citer ce document : Dedieu L. 2014. Rdiger et publier un data paper dans une revue scientifique en 5 points. Montpellier (FRA) : CIRAD, 7 p. http://url.cirad.fr/ist/data-paper Cette oeuvre est mise disposition selon les termes de la Licence Creative Commons : Attribution - Pas dUtilisation Commerciale - Partage dans les Mmes Conditions 4.0 International, disponible en ligne.: http://creativecommons.org/licenses/by-nc-sa/4.0/deed.fr ou par courrier postal : Creative Commons, 171 Second Street, Suite 300, San Francisco, California 94105, USA. Cette licence vous permet de remixer, arranger, et adapter cette oeuvre des fins non commerciales tant que vous crditez lauteur en citant son nom et que les nouvelles oeuvres sont diffuses selon les mmes conditions. 7

Recommended

View more >