Recommandations aux revues souhaitant définir une « politique de données » liées aux publications
Comité pour la science ouverte – collège Données de la recherche
Mars 2021
Une version en langue anglaise est disponible.
Ce document est mis à disposition des revues et des comités éditoriaux qui souhaitent mettre en place une data policy ou « politique de données ». Une politique de données définit ce que la revue attend de ses auteurs et autrices en matière de gestion et de diffusion des données liées à ses publications.
Ce document s’adresse en particulier aux éditeurs de revues en sciences humaines et sociales, dans la mesure où ils se sont relativement moins emparés de ce sujet que leurs homologues en sciences, technologies et médecine. Il peut cependant être utile à tous les éditeurs, quel que soit le périmètre disciplinaire de leur revue.
Les politiques de données sont de nature différente selon la nature des incitations et prescriptions qu’elles proposent, en particulier selon qu’elles :
- incitent ou obligent à diffuser tout ou partie des données qui sous-tendent les publications ;
- précisent des modalités de mise à disposition des données : délai, format, licence de partage… ;
- soumettent les données au processus de revue par les pairs au même titre que les publications.
Afin de mettre en place progressivement leur politique de données, les revues peuvent s’appuyer sur des typologies existantes (RDA propose par exemple 6 types de politique de données, Springer en définit 4).
Les données de la recherche comprennent l’ensemble « des documents se présentant sous forme numérique, autres que des publications scientifiques, qui sont recueillis ou produits au cours d’activités de recherche scientifique et utilisés comme éléments probants dans le processus de recherche, ou dont la communauté scientifique admet communément qu’ils sont nécessaires pour valider des conclusions et résultats de la recherche » [1]Directive (UE) 2019/1024 du Parlement européen et du Conseil du 20 juin 2019 concernant les données ouvertes et la réutilisation des informations du secteur public, s.l., 2019, vol.OJ L..
Ce document est structuré en 7 sections et 4 colonnes :
- la 1re colonne comprend le nom de la section ;
- la 2e colonne est une description de la section présentée ;
- la 3e colonne précise les enjeux de la section et les questions que doivent se poser les revues ;
- la 4e colonne propose des exemples de formulation qui sont donnés à titre indicatif.
Ce document a été produit par le Collège Données de la recherche du Comité pour la science ouverte. Il est diffusé sous licence Creative Commons CC-BY et s’appuie notamment sur :
- Iain Hrynaszkiewicz, Natasha Simons, Azhar Hussain, Rebecca Grant, Simon Goudie. “Developing a Research Data Policy Framework for All Journals and Publishers”. Data Science Journal, 19 (1). 2020. DOI: https://doi.org/10.5334/dsj-2020-005 ;
- l’adaptation qui en a été faite par l’Université de Toulouse-Jean Jaurès.
Chloée Fabre, Françoise Gouzi. Proposition de modèle de politique pour les revues et éditeurs quant aux données de la recherche. 2020. ⟨hal-03026731⟩.
Citer ce document : Romain Féret [2]Normandie Université, Université de Lille, Françoise Gouzi [3]Université Toulouse – Jean Jaurès, Sandra Guigonis [4]Open Edition Center (UAR 2004), CNRS, Université d’Aix-Marseille, EHESS, Université d’Avignon, Hélène Jouguet [5]Huma-Num (UAR 3598), CNRS, Université d’Aix-Marseille, Campus Condorcet, Nicolas Larrousse [6]Huma-Num (UAR 3598), CNRS, Université d’Aix-Marseille, Campus Condorcet, Armelle Thomas [7]Maison des sciences de l’homme de Dijon (uB – CNRS). Recommandations aux revues souhaitant définir une « politique de données » liées aux publications. Collège Donnée de la recherche du Comité pour la science ouverte. 2021
Section | Description | Enjeux et points à considérer | Exemples de formulation |
1. Définition des données de recherche et exceptions | Décrit les données auxquelles la politique s’applique.
Précise les exceptions éventuelles à cette politique. |
Enjeux
Points à considérer
|
Cette politique s’applique aux données de la recherche qui seraient nécessaires pour vérifier les résultats présentés dans les publications de la revue.
Les données de la recherche comprennent les données produites par les auteurs ainsi que les données provenant d’autres sources qui sont analysées par les auteurs dans leur étude. Ces données peuvent se présenter sous des formes variées : images, vidéos, tableaux de statistiques… Les données de la recherche qui ne sont pas nécessaires pour vérifier les résultats rapportés dans les contributions ne sont pas couvertes par cette politique. Cette politique sera limitée par les exceptions légitimes encadrées par la loi, par exemple en ce qui concerne le secret professionnel, les secrets industriels et commerciaux, les données personnelles ou les contenus protégés par le droit d’auteur. |
2. Standards et formats des données (et métadonnées) | Liste les standards principaux (et/ou les ressources où les trouver) utilisés pour les données et les métadonnées associées.
Inclut nécessairement les protocoles de diffusion associés principalement aux métadonnées. |
Enjeux
Points à considérer
|
La revue incite les auteurs à privilégier les formats ouverts et standards. À titre d’exemple, la conformité des fichiers de données en vue d’un archivage pérenne auprès du CINES peut être vérifiée sur : https://facile.cines.fr
Les métadonnées descriptives doivent être structurées en employant des standards reconnus, au minimum Dublin Core, disciplinaires ou plus génériques. L’utilisation de vocabulaires dits « contrôlés », disciplinaires ou plus génériques, pour exprimer ces métadonnées est fortement recommandée (e.g. pour référencer un auteur https://orcid.org ; pour référencer un lieu https://www.geonames.org). |
3. Accès aux données et hébergement | Explique la manière dont les données devraient être hébergées pour que leur accès soit sécurisé et garanti sur le plus long terme possible.
Précise si le dépôt des données dans un entrepôt spécifique est préconisé et, le cas échéant, ses caractéristiques (e.g. certification, degré de conformité avec les principes FAIR, pertinence par rapport à la discipline concernée, etc.) |
Enjeux
Points à considérer
|
Les données qui ont concouru à la rédaction de la contribution devront être déposées dans un entrepôt de données qui garantira la sécurisation du stockage et l’accès aux données, notamment par l’attribution d’un identifiant pérenne.
Nous conseillons aux auteurs d’éviter l’utilisation des entrepôts de statut privé dont la feuille de route n’est pas transparente : modèle économique, gouvernance, pérennité… (ex. Figshare). Si la revue souhaite recommander un entrepôt particulier La revue recommande le dépôt des données dans l’entrepôt disciplinaire [Nom de l’entrepôt] (ex. Nakala en sciences humaines et sociales). Dans ce cas, décrire l’entrepôt et le lien entre la revue et l’entrepôt : support proposé aux auteurs, collection de la revue sur l’entrepôt… Si la revue souhaite faire des recommandations généralistes La revue recommande le dépôt des données dans un entrepôt qu’il soit généraliste (ex. Zenodo), institutionnel (ex. Data INRAE) ou disciplinaire (ex. beQuali pour les données d’enquête qualitatives). Dans tous les cas, les auteurs sont invités à vérifier que l’entrepôt choisi répond aux principaux critères de qualité suivants : https://doranum.fr/depot-entrepots/criteres-choix-entrepot/ |
4. Modalités de mise à disposition des données | Explicite comment les données devront être mises à disposition et dans quel délai.
Précise si les données font l’objet d’une évaluation par les pairs et sous quelles modalités. |
Enjeux
Auteurs
Relecteurs
Points à considérer
|
Phase de soumission
Les auteurs n’ont pas à transmettre leurs données lors de la soumission de leur contribution. Phase d’évaluation Si les relecteurs le jugent nécessaire, les auteurs doivent être en mesure de mettre à leur disposition les données qui sous-tendent les résultats présentés dans leur contribution. Phase d’acceptation Les données devront être diffusées sans embargo ou après un délai le plus court possible, selon des modalités permettant leur réutilisation, avec un lien explicite entre les données et la publication qu’elles sous-tendent (voir sections 4 et 5). La revue encourage la mise à disposition des données sous des licences ouvertes qui permettent leur libre réutilisation. Les auteurs doivent utiliser les licences préconisées par l’entrepôt où les données ont été déposées. En publiant dans cette revue, les auteurs attestent de leur capacité à mettre les données et métadonnées à disposition du public pendant au moins 5 ans après la publication de leur contribution, par l’intermédiaire d’une plateforme ou par mise à disposition individuelle si les données ne peuvent être diffusées librement. Les alternatives à la diffusion en libre accès de données personnelles ou sensibles sont :
|
5. Soutien aux auteurs et aux relecteurs | Décrit l’accompagnement que la revue propose aussi bien à destination de ses auteurs que de ses relecteurs. | Enjeux
Points à considérer
|
Pour toute question relative à la politique de données de notre revue, les auteurs peuvent écrire à : revue.donnees[at]
Nous invitons les auteurs à se rapprocher des services support de leur établissement en ce qui concerne les bonnes pratiques de gestion et diffusion des données. S’il existe un plan de gestion des données lié à ces données, les auteurs sont vivement invités à le consulter pour y trouver des réponses à leurs questions. |
6. Lien entre publications et données | Décrit les mécanismes d’association entre les données et les publications ainsi que les prérequis pour les réaliser comme par exemple l’affectation systématique d’identifiants pérennes. | Enjeux
Points à considérer
|
Les auteurs sont invités à citer les jeux de données qui sous-tendent leurs publications dans une section spécifique « Données de recherche ». Cette section doit décrire les données disponibles, les modalités d’accès à ces données et fournir un lien pérenne pour y accéder.
Cette section peut prendre une des formes suivantes ou une combinaison de celles-ci :
|
7. Cas de non-respect de la politique | Décrit les risques encourus par les auteurs en cas de non-respect de la politique, afin d’éviter tout différend.
Précise les procédures prévues en interne pour traiter ce genre de cas. |
Enjeux
Points à considérer
|
Cas d’une politique incitative
Cette politique a uniquement une valeur incitative. Aucune sanction n’est prévue dans le cas où les auteurs ne se conforment pas avec cette politique. Cas d’une politique coercitive Si une contribution ne respecte pas les règles prévues de mise à disposition des données, les auteurs en seront informés par le comité éditorial et ils disposeront d’un mois pour se mettre en conformité avec la politique de la revue. Si à l’issue de ce délai la contribution ne respecte toujours pas la politique de la revue, un bandeau sera ajouté en haut de l’article pour préciser en quoi la politique de la revue n’est pas respectée. Si l’incapacité à fournir les données remet en cause la crédibilité de la contribution ou qu’il est établi que certaines données sur lesquelles la contribution s’appuie sont erronées, la revue se réserve le droit de le rétracter. |
References