La fouille de textes et de données à des fins de recherche : une pratique confirmée et désormais opérationnelle en droit français

Actualités du comité
16/12/2021

La fouille de textes et de données à des fins de recherche : une pratique confirmée et désormais opérationnelle en droit français grâce à la transposition de la directive européenne sur le droit d’auteur et les droits voisins dans le marché unique numérique

Une « exception » en faveur de la fouille de textes et de données à des fins de recherche introduite dans la loi française 

Adoptée le 24 novembre 2021 https://www.legifrance.gouv.fr/jorf/id/JORFTEXT000044362034, une ordonnance de transposition de la directive européenne 2019/790 sur le droit d’auteur et les droits voisins dans le marché unique numérique (https://eur-lex.europa.eu/legal-content/FR/TXT/?uri=celex%3A32019L0790) a introduit dans le droit français une exception aux règles du droit d’auteur, applicable à l’exploration automatisée de textes et de données (Text and Data Mining ou TDM). Ces dispositions ouvrent de nouvelles perspectives en facilitant la conduite de traitements automatisés visant à extraire des connaissances à partir de contenus protégés par des droits de propriété intellectuelle.

Longtemps attendue, il s’agit d’une avancée significative pour la recherche, dont bénéficiaient déjà des pays comme le Royaume-Uni, l’Allemagne, le Japon ou les États-Unis. Il s’agit à présent pour les établissements de recherche de mettre en œuvre cette exception. D’application immédiate, l’ordonnance du 24 novembre 2021 ouvre le champ du TDM à une diversité de contenus, sous réserve de respecter certaines conditions.

Un champ d’application étendu : données, images fixes ou animées, sons, musiques, logiciels

En 2016, en France, la possibilité de recourir au TDM avait déjà été intégrée dans la Loi pour une République Numérique (https://www.legifrance.gouv.fr/jorf/article_jo/JORFARTI000033202882). En raison d’un avis défavorable du Conseil d’Etat, les décrets d’application correspondants n’avaient cependant pas pu être édictés. L’adoption en 2019 de la directive européenne sur le droit d’auteur et les droits voisins dans le marché unique numérique (https://eur-lex.europa.eu/legal-content/FR/TXT/?uri=celex%3A32019L0790) a relancé le processus. Cette directive comporte en effet des dispositions relatives au TDM, que les Etats membres ont eu l’obligation de transposer dans leur droit national dans un délai de deux ans, soit en 2021.

La France s’est acquittée de cette obligation en adoptant l’ordonnance du 24 novembre 2021, qui reprend naturellement la définition européenne du TDM  : « On entend par fouille de textes et de données […] la mise en œuvre d’une technique d’analyse automatisée de textes et données sous forme numérique afin d’en dégager des informations, notamment des constantes, des tendances et des corrélations. »

Conformément à la directive européenne, l’ordonnance permet de reproduire des contenus protégés par des droits de propriété intellectuelle dans le but de conduire des activités de fouille à des fins de recherche scientifique, sans avoir à recueillir d’autorisation préalable des « titulaires de droits » (les producteurs des bases de données, les propriétaires des textes et/ou des données ciblés par le TDM : entreprises, éditeurs, …) ou à obtenir des licences de leur part. C’est dans cette dispense d’autorisation que réside l' »exception ». Aux termes de l’ordonnance, le champ d’application de cette exception est plus large que celui initialement prévu par la loi française pour une République Numérique. Il est en effet à présent possible de conduire des opérations de TDM non seulement sur des textes, mais également sur tous les types de contenus numériques : données, images fixes ou animées, sons, musiques, logiciels, etc.

Les copies obtenues sur la base de cette « exception » en faveur du TDM peuvent être conservées « avec un niveau de sécurité approprié » par ses bénéficiaires, notamment pour permettre la conduite de nouvelles recherches scientifiques ou servir à la vérification de résultats. Ces dispositions, là aussi plus permissives que celles définies en 2016 par les dispositions nationales, devraient permettre de constituer des archives du TDM, avec pour effet de  renforcer la reproductibilité des résultats de recherche et le caractère cumulatif de la science.

Des conditions à respecter : accès licite, intégrité, sécurité 

L’exception bénéficie aux organismes de recherche, mais aussi aux bibliothèques ouvertes au public, aux musées, aux services d’archives et aux institutions dépositaires du patrimoine cinématographique, audiovisuel ou sonore.

Du point de vue de ces bénéficiaires, la principale condition à respecter pour être en mesure de mobiliser cette exception consiste à utiliser des contenus protégés disponibles uniquement par le biais d’un accès licite. Celui-ci est susceptible de revêtir différentes formes : il peut s’agir en premier lieu de ressources ayant fait l’objet d’une acquisition ou ayant été mises à disposition par le biais d’un abonnement, comme c’est le cas des bases de données auxquelles souscrivent les bibliothèques universitaires. Il peut s’agir également de contenus en libre accès sur Internet, à condition qu’ils aient été diffusés de manière licite.

Les titulaires de droits   sont quant à eux autorisés par l’ordonnance à mettre en œuvre « des mesures proportionnées et nécessaires afin d’assurer la sécurité et l’intégrité des réseaux et des bases de données dans lesquels les œuvres sont hébergées« . Ces termes peuvent renvoyer à des systèmes d’authentification ou à des accès de type API (Application Programming Interface). Il s’agira sans doute de la condition la plus complexe à mettre en œuvre, sachant néanmoins que la directive européenne précise que ces mesures de protection ne devront pas « excéder ce qui est nécessaire pour atteindre l’objectif » de sécurisation.

L’exception est mobilisable y compris dans le cadre d’un partenariat entre des acteurs publics et des acteurs privés, dès lors que ce partenariat n’a pas de but lucratif. En revanche, lorsqu’une entreprise est actionnaire ou structurellement associée à un organisme de recherche et bénéficie par ce biais d’un accès privilégié aux données, alors cet organisme ne peut mobiliser l’exception à des fins de recherche scientifique. Il s’agit donc à la fois de préserver l’exercice de l’exception dans le cadre de partenariats publics-privés, tout en garantissant qu’elle n’est pas mobilisée dans le cadre d’activités de nature commerciale.

À noter que l’ordonnance contient également une limitation au droit d’auteur, applicable aux opérations de fouille de textes et de données conduites en dehors des finalités de recherche scientifique. Son champ d’application est plus large (elle peut directement bénéficier à des entreprises), mais dans ce cas, les titulaires de droits disposeront d’un « opt-out » (option de retrait). Ils pourront en effet s’opposer aux opérations de fouille « par des procédés lisibles par machine pour les contenus mis à la disposition du public en ligne« .

Un texte immédiatement applicable 

Contrairement à l’exception de TDM qui figurait dans la loi de 2016, celle-ci est directement applicable, le texte n’appelant de décret d’application. L’ordonnance mentionne qu’un accord pourra intervenir entre les représentants des institutions bénéficiaires de l’exception et ceux des titulaires de droits, pour « définir les bonnes pratiques relatives à la mise en œuvre » de l’exception. Mais il ne s’agit pas pour autant d’une condition préalable à l’entrée en vigueur du texte.

Cette exception en faveur de la fouille de textes et de données est donc immédiatement mobilisable dans le cadre de projets de recherche. Elle doit néanmoins s’articuler avec les autres textes applicables en vigueur, notamment ceux relatifs à la protection des données (notamment personnelles : RGPD, etc.), lorsque les contenus à fouiller en contiennent.

Notons enfin que cette exception est gratuite, dans le sens où aucune compensation n’est à verser aux titulaires de droits, à l’inverse de ce qui existe pour d’autres exceptions comme la copie privée ou l’exception pédagogique.

Billet rédigé par Lionel Maurel et Stéphanie Rennes, Groupe d’expertise juridique du comité pour la science ouverte.