SYNTHÈSE DES PROPOSITIONS
La science ouverte ne doit pas se faire n'importe comment ni à n'importe quel prix : le pluralisme de l'expression scientifique et la diversité de ses canaux de diffusion doivent être préservés. La politique de la science ouverte et de l'édition scientifique qui est promue ici se veut réaliste car c'est une condition pour qu'elle soit effective, équilibrée car il faut tenir compte de la diversité des acteurs de la diffusion du savoir scientifique et respectueuse de la liberté académique car c'est d'abord en respectant l'autonomie des scientifiques que l'on défend la science. Elle nécessitera une coordination interministérielle plus poussée, la problématique dépassant le champ strict des attributions du ministère de l'enseignement supérieur, de la recherche et de l'innovation, aujourd'hui seul à la barre. Le remaniement de cette politique publique visera le pluralisme et la bibliodiversité car l'ouverture de la science doit prendre plusieurs voies, le modèle Diamant ne saurait en être qu'une parmi d'autres. Il en ressort une série de huit propositions :
1. Définir et mettre en oeuvre dans une logique réellement interministérielle, associant notamment les ministères chargés de l'enseignement supérieur, de la recherche et de la culture, une politique équilibrée et concertée de la science ouverte et de l'édition scientifique assurant un soutien aux petits éditeurs ;
2. Faciliter le dialogue entre toutes les parties prenantes et réformer l'Observatoire de l'édition scientifique en le rapprochant du Médiateur du livre et du Comité pour la science ouverte ;
3. Respecter la liberté académique, l'indépendance des chercheurs, la liberté de divulgation et le droit d'auteur ;
4. Favoriser la voie du pluralisme par la bibliodiversité plutôt que programmer l'hégémonie future du modèle Diamant ;
5. Mieux évaluer les effets de la politique de la science ouverte et conditionner toute mesure nouvelle à des études d'impact approfondies ;
6. Renforcer le rôle du Parlement en matière de science ouverte ;
7. Réviser les modalités d'évaluation des chercheurs, au profit de critères plus qualitatifs afin de réduire la pression à la publication ;
8. Prévoir des formations aux enjeux de la science ouverte dans tous les milieux de la recherche.
AVANT-PROPOS
Saisi par la commission de la culture du Sénat, l'Office parlementaire d'évaluation des choix scientifiques et technologiques a conduit à la fin de l'année 2021 et au tout début de l'année 2022 une étude sur la science ouverte qui s'inscrit dans la continuité de son précédent rapport intitulé « Promouvoir et protéger une culture partagée de l'intégrité scientifique » 4 ( * ) . Ce travail montrait que l'intégrité scientifique impliquait de questionner l'ensemble de l'environnement de la recherche, et notamment le parcours de publication scientifique mais également les modalités d'évaluation des chercheurs et de leurs travaux 5 ( * ) .
Dans le contexte d'importantes pressions systémiques exercées sur le monde de la recherche et ses acteurs (bibliométrie, évaluation de la recherche, course à la publication...), la science ouverte, qui désigne selon le comité pour la science ouverte (CoSo) « la diffusion sans entrave des publications et des données de la recherche », doit permettre une meilleure accessibilité de la recherche, l'amélioration de la transparence et une plus grande reproductibilité des travaux.
Cette définition aux contours assez flous peut être entendue dans un sens restreint ou élargi . Selon les contextes et les spécialistes il s'agit de la science au sens strict de la recherche scientifique ou, dans un sens plus large, de toute information scientifique. Et les entraves qu'il conviendrait de lever peuvent être entendues comme des limites temporaires, ou techniques, ou économiques, ou juridiques, donnant à la science ouverte une ambition plus ou moins grande selon les conceptions.
Derrière les discours favorables à la science ouverte, devenue un mot d'ordre militant plus qu'une modalité d'organisation de l'accès à la recherche scientifique, le présent rapport entend dresser un état des lieux sans concession de la science ouverte, de ses enjeux et de ses formes diverses, pour en identifier les opportunités mais aussi les risques et ce afin de proposer quelques pistes d'évolution .
La dernière partie du rapport formule donc des préconisations pour une politique de la science ouverte réaliste, équilibrée et respectueuse de la liberté académique , avec la double préoccupation de se prononcer en faveur de la transparence, de l'ouverture et du partage des publications et des données mais aussi de proposer une voie concertée impliquant des changements raisonnables pour le monde de l'édition, en particulier les petits éditeurs privés.
Cette Realpolitik de la science ouverte , appelée de ses voeux par l'Office, s'avère nécessaire à l'heure où cette dernière tend à être instrumentalisée, tel un mantra incantatoire, pour servir de boussole, voire de supplément d'âme , à des institutions de l'enseignement supérieur en manque d'inspiration ainsi qu'à un monde de la recherche en perte de repères.
I. COMPRENDRE LA SCIENCE OUVERTE
A. L'HISTOIRE DES AVANCÉES VERS LA SCIENCE OUVERTE
1. Une question ancienne : ce qu'ouvrir la science veut dire
Ouvrir la science 6 ( * ) n'est pas une démarche anodine. Depuis le Colloque d'Erasme de 1527 « Les Choses et les Mots », consacré à l'apparence et à la réalité du discours du savoir jusqu'à l'actualisation de la discussion par l'ouvrage Les Mots et les Choses publié en 1966 par Michel Foucault 7 ( * ) , s'affirme, « dans un long chemin » selon Renaud Fabre, l'idée selon laquelle « les sciences ne sont fidèles à leur patrimoine qu'en sécrétant un système de règles propres à chaque époque » 8 ( * ) .
En faisant des instruments scientifiques des « théories matérialisées », ce qu'il appelait la phénoménotechnique, Gaston Bachelard démontrait que toute théorie était en fait une pratique, toute nouvelle pratique engendrant une nouvelle théorie scientifique, celle-ci conduisant à une nouvelle philosophie de la science 9 ( * ) .
En 1777, Beaumarchais fait valoir que les idées sont de « libre parcours » et que les auteurs doivent pouvoir disposer de droits sur leurs oeuvres. La reconnaissance légale du droit auteur intervient avec la loi du 13 janvier 1791 votée par l'Assemblée Constituante, l'une des premières règles adoptées dans le monde pour protéger les auteurs et leurs droits 10 ( * ) . Cette évolution s'articule avec l'ouverture du monde scientifique et la publication de revues.
Même si quelques textes sur la nature ou la médecine ont pu circuler dans les civilisations grecque, romaine, chinoise et arabe, il convient d'observer qu'en Occident ce mouvement puise surtout aux sources des savants du temps de la « République des Lettres », qui ont ressenti le besoin de faire connaître et de partager de manière plus formalisée leurs recherches 11 ( * ) .
Ainsi que l'a rappelé très récemment le coordinateur national de la science ouverte Marin Dacos 12 ( * ) , lorsque le « Journal des sçavans » naît à Paris en 1665, le monde de la recherche innove dans le domaine de la communication scientifique en inventant la première revue au monde : « le succès de cette innovation a contribué fortement à la construction de la science contemporaine. On lui doit, en tant que medium, une accélération et une amplification de l'impact des écrits des chercheurs ».
Il faut cependant rappeler, pour être juste, que la même année, certes trois mois plus tard, la Royal Society britannique, créée en 1660, fait paraître à Londres les « Philosophical transactions ». Cette institution scientifique précède de six ans la naissance de l'Académie des sciences, que la France met en place en 1666.
Cette double nouveauté - des académies et des revues - est rapidement suivie d'une duplication accélérée : au moment de la Révolution Française on dénombre dans le monde plus de 70 académies 13 ( * ) et environ un millier de revues 14 ( * ) .
En réalité, jusqu'au XVII e siècle - et cette viscosité a eu parfois tendance à perdurer au-delà - les découvertes ne se propagent que très lentement et les scientifiques se contentent le plus souvent d' échanges bilatéraux , en s'échangeant dans le cadre de leur correspondance de simples courriers. La discrétion pouvait même aller jusqu'à dissimuler les savoirs scientifiques pour se protéger des pouvoirs politiques et religieux 15 ( * ) .
Dans certains cas, cette absence de publicité a conduit à des conflits d'attribution, à l'instar de la fameuse controverse entre Newton et Leibniz sur le calcul intégral 16 ( * ) . Cette situation n'est plus possible avec la nouvelle économie du savoir qui fait des revues le support principal de la communication scientifique .
Selon Julien Roche, l'étape suivante consiste en l'apparition de grandes bibliothèques de recherche , qui prennent un rôle central dans la diffusion ouverte du savoir publié, notamment à travers la systématisation des catalogues ou encore la mise en place d'un système global de prêt de documents entre bibliothèques. Des collections sont en effet rassemblées et ordonnées, visibles à travers les catalogues des bibliothèques, accessibles surtout au public savant et universitaire.
L'évolution vers la publication scientifique est donc une marche lente et très progressive , conditionnée par l'émergence et l'usage de moyens technologiques, permettant à des populations de plus en plus nombreuses de bénéficier plus largement du progrès scientifique et de ses applications.
Qu'il s'agisse de revues ou de livres (« monographies »), les éditeurs ont joué depuis trois siècles un rôle de premier plan dans cette histoire mêlée des sciences et de l'édition, la vie scientifique s'étant peu à peu structurée autour de la publication avec des modèles variables 17 ( * ) .
On estime le nombre actuel de périodiques scientifiques entre 50 000 et 100 000 dans le monde. L' internationalisation de la science constitue dans la même période de trois siècles un processus de fond qui a bouleversé les voies et les moyens de l'information scientifique .
Dans son essai La Galaxie Gutenberg 18 ( * ) , le philosophe Marshall McLuhan annonçait dans la seconde moitié du XX e siècle la fin de la « galaxie Gutenberg » pour entrer dans la « galaxie Marconi », une transition de la civilisation de l'impression , marquée par les publications 19 ( * ) , vers l'ère de l'électricité, de l'électronique et des technologies de la communication, du son et de l'image . Pour lui, les sociétés façonnées par le progrès technique connaissent des transformations de civilisation au rythme de ces changements de paradigmes de médias culturels.
Internet constitue à l'évidence le dernier de ces avatars. L'émergence puis la diffusion massive de cette révolution numérique remettent en question tous les modèles issus de l'histoire des technologies traditionnelles. Et cela se traduit par de nouveaux usages et de nouvelles normes , y compris en matière économique et juridique, avec des communautés scientifiques et des industries culturelles forcées de se réinventer.
2. La révolution numérique et ses implications
La science ouverte telle qu'elle est entendue au XXI e siècle puise aux sources de la révolution numérique et de la mondialisation culturelle qu'elle accompagne et renforce 20 ( * ) . Avant même les bibliothèques numériques ouvertes sur la toile, on voit arriver, dans les années 1980 et 1990, les premiers réseaux distribués propres au monde scientifique et des capacités de stockage et de transport nouvelles , facilitées par les CD-Roms. Ces avancées ont permis de franchir une étape décisive dans la diffusion large de contenus, éventuellement libres de droits.
En effet, il faut bien voir que le projet d'une « science ouverte » a été rendu possible par la révolution numérique qui s'est accélérée dans les années 1990 et 2000. Les progrès enregistrés en informatique, en stockage de ressources numériques et, surtout, en matière de réseaux de communication , tels qu'Internet, ont profondément transformé le rapport à la connaissance, du point de vue de son accès, de sa diffusion et plus généralement de sa représentation 21 ( * ) . La démocratisation et la massification de ces outils ont amplifié ces tendances.
Internet, réseau distribué, s'est, dès sa mise en place dans les années 1980, accompagné d'une mobilisation associative et politique en faveur du logiciel libre 22 ( * ) et de la libre circulation de l'information, notamment par le recours à certaines technologies peer-to-peer (pair-à-pair). Cette mobilisation a produit des discours utopistes sur le caractère libérateur de la technologie 23 ( * ) , qui s'opposerait au caractère centralisé de nos États et de nos économies en vue d'un contournement des hiérarchies instituées par des logiques coopératives et participatives 24 ( * ) . Dans un rapport de 2018 consacré aux blockchains 25 ( * ) , l'Office rappelait ainsi que « l'émergence des cryptomonnaies a partie liée avec le mouvement pour le logiciel libre, initié dans les années 1980 par Richard Stallman autour de la Fondation pour le logiciel libre (Free Software Foundation) et du système d'exploitation libre GNU, ainsi qu'avec la communauté « cypherpunk ». Cette communauté joue un rôle essentiel dans l'écosystème des cryptomonnaies depuis une trentaine d'années ».
La même communauté de hackers idéalistes travaille aussi à la diffusion gratuite et immédiate des données scientifiques, faisant fi du droit de la propriété intellectuelle. Pourtant l'extraction de contenu de sites Internet, fréquente en matière commerciale 26 ( * ) , peut s'apparenter à du piratage informatique . Le contenu des plateformes est parfois copié sans autorisation, ce qui permet de contourner les barrières d'accès aux articles. C'est ce qui est arrivé à JSTOR en 2010 à partir d'un serveur du MIT : le hacker activiste responsable de ce téléchargement massif - Aaron Swartz - arrêté par la police du MIT est poursuivi et se suicide tragiquement en 2013. JSTOR - qui ne poursuivait pas Swartz - modifiera sa politique d'accès et le MIT sera très critiqué pour avoir pris la décision d'engager des poursuites.
Bien qu'étant devenu un outil très utilisé et incontournable pour beaucoup d'acteurs de la recherche scientifique, le site Sci-Hub fondé en 2011 par Alexandra Elbakyan constitue, par exemple, le meilleur cas de bibliothèque clandestine (Z-Library et Genesis ou LibGen en sont deux autres exemples).
Il s'agit, en effet, de mettre illégalement à disposition du contenu normalement payant 27 ( * ) , par un contournement des droits d'auteurs et des paywalls ou « péage de lecture numérique » selon la traduction de la commission d'enrichissement de la langue française. Profitant de brèches ( biblioleaks ), voire en les suscitant par des cyberattaques, ce piratage pur et simple représente une forme de hacking informatique parmi d'autres, qui n'est pas plus noble que les autres, en dépit de son utilisation massive par les jeunes chercheurs et de sa spécialisation sur les données scientifiques, perçues comme un bien commun.
Cette violation du droit d'auteur à grande échelle constitue une menace pour les communautés scientifiques, et pas que pour les éditeurs, ouvrant la porte à de possibles dérives, d'autant plus que cet acte de piraterie scientifique se pare des habits de la générosité et du partage.
À l'heure de la tentation d'une communication de plus en plus directe des résultats scientifiques, des logiques de contrôle et de vigilance sont nécessaires pour garantir l'intégrité de la recherche. La justice américaine en 2017 puis le tribunal de grande instance de Paris le 7 mars 2019 ont ainsi déclaré Sci-Hub illégal et ordonné aux grands fournisseurs d'accès à Internet de bloquer l'accès de leurs abonnés à Sci-Hub.
La France reste toutefois le premier pays utilisateur de Sci-Hub , si l'on rapporte le nombre de téléchargements à la population et le troisième en valeur absolue 28 ( * ) . Une carte des utilisateurs parue dans Science montre que le téléchargement illégal n'est pas l'apanage des pays en développement, mais bien un problème international, qui touche tous les pays 29 ( * ) . Par ailleurs, il faut reconnaître que ces bibliothèques pirates augmentent l'impact et la visibilité des travaux scientifiques : selon une étude de l'université Cornell, les articles qui se trouvent sur Sci-Hub reçoivent 1,72 fois plus de citations que les articles de revues de qualité similaire non disponibles sur Sci-Hub.
Sans exagérer l'impact de ces bibliothèques clandestines, il ne faut pas sous-estimer le fait que la révolution numérique a été un basculement profond : à la fois, selon Jean-Yves Mérindol 30 ( * ) , car l'informatique et Internet ont bouleversé les modes de publication et de diffusion des revues et monographies , notamment avec l'émergence de l' Open access , et parce que dans le même temps l'édition scientifique a intégré de nouveaux processus rendus possibles par l'informatisation et la numérisation. La grande majorité des revues scientifiques sont par exemple passées du support papier au support numérique, parfois couplé au papier.
Le rôle des acteurs (éditeurs, universités et organismes de recherche, sociétés savantes, collectifs scientifiques, autorités politiques, etc.) a changé au rythme de ces nouvelles possibilités et de ces nouveaux usages permis par les technologies : bases de données, indexation, bibliométrie, plateformes d'articles et de revues numériques, licences de type Creative Commons 31 ( * ) et, plus globalement, essor de la science ouverte, conduisant à la remise en question des modèles traditionnels et à l'émergence d'autres modèles économiques plus adaptés à la diffusion sur les réseaux numériques. Comme l'a écrit Lawrence Lessig dès 1999 32 ( * ) , le code a tendance à dicter sa loi.
L' édition électronique se développe constamment et offre de nouvelles fonctionnalités pour les auteurs, les éditeurs, les bibliothèques et les lecteurs. La bibliométrie , déjà présente dans le monde du papier (Eugène Garfield a fondé l'Institute for Scientific Information en 1960 et Science citation direct en 1964), prodigieusement raffinée et amplifiée avec la mise en place de gigantesques bases de données (Scopus, Web of Science ), s'est imposée dans de nombreux domaines (classements, facteur h, impact factor , etc.), pour le meilleur mais aussi pour le pire.
La numérisation rétroactive des revues papier est maintenant quasiment généralisée, menée parfois par des éditeurs eux-mêmes, parfois par des consortia (JSTOR), parfois par des institutions publiques (Gallica, Persée et Numdam en France) 33 ( * ) . Mais il reste encore des efforts à fournir à ce niveau. L'accès aux articles scientifiques se fait désormais presque exclusivement par le biais de plateformes variées (éditeurs, inter-éditeurs, institutionnelles, preprints numériques, archives anciennes, etc.).
La lecture en bibliothèque des revues, pour feuilleter les fascicules en présentoir ou pour consulter les volumes reliés pour garantir leur préservation, a cédé le pas à la consultation en ligne et au téléchargement à partir d'un ordinateur . Alors que dans la France des années 1990, un nombre limité d'universités pouvait offrir à leurs étudiants et chercheurs un vaste choix d'abonnements, depuis le milieu des années 2000, la plupart des universités et écoles supérieures ont accès à une offre plus large que celle accessible dix ans plus tôt aux établissements les mieux pourvus. Cette extension a bénéficié à un nombre restreint d'éditeurs internationaux , et tout particulièrement à ceux qui ont su anticiper ces évolutions dès la fin des années 1980.
D'autres innovations apparues au cours des trente dernières années peuvent être mentionnées. Les auteurs déposent de plus en plus souvent leurs articles sur des serveurs dits en prépublication ( preprints en anglais), avant même leur évaluation, les communiquant ainsi sans délai à toute la communauté scientifique qui dispose de la possibilité de les discuter afin de les améliorer 34 ( * ) .
De même, ont émergé, à l'initiative d'entreprises commerciales le plus souvent, des réseaux sociaux académiques et des forums scientifiques , de plus en plus utilisés. GoogleScholar créé en 2004 ou ResearchGate en 2008 sont parmi les plus connus mais ResearchBlog, Academia.edu, ou MyScienceWork peuvent aussi être mentionnés. Ces réseaux sociaux, très fortement utilisés, connaissent un certain succès et disposent d' algorithmes 35 ( * ) permettant aux chercheurs de suivre les recherches pouvant les intéresser. À certains égards, ils peuvent se poser en rivaux des plateformes des éditeurs ou des agrégateurs mais ils ne permettent pas toujours d'accéder au contenu des revues et livres, se contentant surtout d'être efficaces pour obtenir leur seul référencement 36 ( * ) .
En outre, la communication scientifique directe via les réseaux sociaux (Twitter ou Youtube par exemple) est aussi une réalité qui ne peut être ignorée.
Toutes les transformations profondes rappelées ici sont autant de conditions de possibilité ayant permis de penser l'utopie d'une science gratuite, accessible et participative , c'est-à-dire de se projeter vers le projet d'une science ouverte .
3. L'extension du domaine de la science ouverte : publications, données, logiciels et autres
L'histoire de la science ouverte est celle des étapes de son élargissement . De l'accès ouvert aux publications dans les revues spécialisées, son domaine s'est élargi vers les données 37 ( * ) , les logiciels et matériels, mais aussi encore plus largement à l'évaluation, aux ressources éducatives, carnets de notes, infrastructures, laboratoires avec l'idée d'une science citoyenne et d'une production participative permettant une innovation ouverte.
Ces aspects, connexes à l'ouverture des publications, notamment la question des données ou celle des logiciels libres, sont des dimensions de la science ouverte trop rapidement évoqués dans le présent rapport. Ils pourront faire l'objet d'analyses approfondies dans de futurs travaux de l'Office .
Les données n'ont pendant longtemps pas été rendues publiques, sauf à de rares exceptions disciplinaires - les sismologues partagent leurs données de recherche, les climatologues se sont récemment mis à les mettre en commun également 38 ( * ) , « les archéologues publient les relevés de leurs fouilles, les juristes publient la jurisprudence en droit, les généticiens publient systématiquement leurs données génétiques, et les astronomes publient leurs observations » 39 ( * ) .
Leur caractère exploratoire, complexe et souvent propre à la paillasse du chercheur les avait tenues à l'écart du mouvement de la publicité , à la différence des articles de revue et des monographies. Si pour la plupart des scientifiques l'ouverture des publications ne pose pas trop de problèmes, en revanche des freins spécifiques existent en matière de données : des procédures de partage trop contraignantes, une ouverture réduite à l' open data par méfiance à l'égard des utilisateurs... Cependant, de plus en plus, la matière première du savoir fait l'objet d'une ouverture. Et les institutions internationales se sont saisies de cet enjeu.
Les composantes de la science ouverte au sens large
Source : Unesco
Dans sa recommandation de novembre 2021 pour la science ouverte 40 ( * ) , l'Unesco désigne ainsi un ensemble de connaissances scientifiques ouvertes dont la principale manifestation est le libre accès aux publications scientifiques, mais également le libre accès aux données de recherche, aux métadonnées, aux ressources éducatives libres, aux logiciels et aux codes sources et aux matériels relevant du domaine public ou protégés par le droit d'auteur, et publiés sous une licence ouverte permettant leur consultation, leur réutilisation, leur utilisation à d'autres fins, leur adaptation et leur distribution dans des conditions spécifiques. Ces ressources doivent pouvoir bénéficier à tous les acteurs de manière immédiate ou aussi rapidement que possible et ce gratuitement. Ces connaissances scientifiques ouvertes font également référence à la possibilité d'une ouverture des méthodologies de recherche et des processus d'évaluation ainsi qu'aux infrastructures de la science ouverte 41 ( * ) , au dialogue ouvert avec les autres systèmes de connaissances 42 ( * ) , et à la participation ouverte ou science citoyenne, qui peut prendre plusieurs formes y compris celle du financement participatif 43 ( * ) .
Il convient d'observer que les sciences participatives ont fait l'objet en France d'un rapport public spécifique en 2016, auquel le présent rapport renvoie 44 ( * ) .
Les utilisateurs doivent se voir plus précisément accorder, selon la recommandation de l'Unesco de 2021, un libre accès :
- aux publications scientifiques, qui englobent notamment les articles de revue et les ouvrages examinés par des pairs, les rapports de recherche et les communications de colloques. Ces publications peuvent être diffusées par des éditeurs sur des plateformes de publication en ligne en libre accès et/ou déposées et immédiatement accessibles dès leur date de publication dans une archive ouverte gérée et tenue à jour par un établissement universitaire, une société savante, un organisme public ou toute autre organisation à but non lucratif bien établie et dévouée au bien commun assurant le libre accès, la distribution non restrictive, l'interopérabilité et la conservation et l'archivage numériques à long terme ;
- aux données de recherche ouvertes, qui comprennent, entre autres, les données numériques et analogiques, tant brutes que traitées, et les métadonnées qui les accompagnent, ainsi que les scores numériques, les enregistrements textuels, les images et les sons, les protocoles, les codes analytiques et les flux de travail pouvant être librement utilisés, réutilisés, conservés et redistribués par quiconque, moyennant citation de la source ;
- aux ressources éducatives libres 45 ( * ) , qui comprennent les matériels d'enseignement, d'apprentissage et de recherche sur tout support - numérique ou autre - relevant du domaine public ou publiés sous licence ouverte, qui autorisent leur consultation, leur utilisation, leur adaptation et leur redistribution gratuites par d'autres, sans restriction ou avec des restrictions limitées ;
- aux logiciels libres et codes sources ouverts, qui englobent généralement les logiciels dont le code source est mis à la disposition du public dans un format convivial, modifiable et lisible par les humains et les machines, sous une licence ouverte qui octroie à d'autres utilisateurs le droit d'accéder au logiciel, de l'utiliser, de le modifier, de l'étendre et de l'étudier, de créer des oeuvres dérivées et de partager le logiciel et son code source, son design ou son concept ;
- au matériel ouvert, qui désigne généralement le cahier des charges d'un objet physique placé sous licence de telle sorte que ledit objet puisse être étudié, modifié, créé et distribué par quiconque offrant au plus grand nombre de personnes possible la capacité de développer, d'adapter et de partager leurs connaissances en matière de conception et de fonctionnement du matériel.
La science ouverte au sens large recouvre donc des domaines très variés . Les initiatives vont rarement jusqu'à couvrir tout ce champ mais elles ont tendance à aller plus loin que le simple accès ouvert aux publications .
Il ne faut pas, au total, confondre la science ouverte, qui est d'abord une politique de la science, avec l'accès ouvert ou Open Access qui n'est qu'une modalité d'accès à des contenus, mobilisée au service de la science ouverte.
* 4 Cf. le rapport de Pierre Henriet, député, et Pierre Ouzoulias, sénateur, n° 428 (2020-2021) au Sénat et n° 3944 (15e législature) à l'Assemblée nationale : http://www.senat.fr/notice-rapport/2020/r20-428-notice.html sur le site du Sénat ou https://www.assemblee-nationale.fr/dyn/15/dossiers/integrite_scientifique sur celui de l'Assemblée nationale
* 5 Certaines recommandations ont pu être intégrées à la loi de programmation de la recherche du 24 décembre 2020, avant même l'achèvement du rapport, ce qui constituait une première pour l'OPECST.
* 6 Dans sa recommandation de novembre 2017 concernant la science et les chercheurs scientifiques, l'UNESCO définit la science comme l'entreprise par laquelle l'être humain fait un effort organisé, dans un esprit de coopération et de compétition, pour découvrir et maîtriser la chaîne des causalités, les relations ou les interactions, au moyen de l'étude objective de phénomènes observés et de sa validation par le partage des résultats et des données et de l'évaluation par les pairs ; rassemble les connaissances ainsi acquises, en les coordonnant, grâce à un effort systématique de réflexion et de conceptualisation ; et se donne ainsi la possibilité de tirer parti de la compréhension des processus et phénomènes qui se produisent dans la nature et dans la société. Cf. https://fr.unesco.org/themes/ethics-science-and-technology/recommendation_science
* 7 Selon Michel Foucault, contributeur sous-estimé à l'histoire des sciences, la modernité est l'âge des sciences humaines et son Histoire de la folie précise les coordonnées de ce moment historique en le définissant comme une configuration dans laquelle l'homme se trouve lié à sa vérité par un rapport d'objectivation alors qu'à l'âge classique, le sujet se définissait par la relation qu'il entretenait avec la vérité, c'est-à-dire par sa capacité à dire le vrai ou à tomber dans le faux, la modernité désigne le moment où il devient l'objet d'un savoir qui affirme détenir sa propre vérité : « si on pose à une science comme la physique théorique ou comme la chimie organique le problème de ses rapports avec les structures politiques et économiques de la société, est-ce qu'on ne pose pas un problème trop compliqué ? (...) si en revanche, on prend un savoir comme la psychiatrie, est-ce que la question ne sera pas beaucoup plus facile à résoudre ? », cf. Michel Foucault, Les mots et les choses. Une archéologie des sciences humaines , Paris, Gallimard, 1966, p. 376. Cette archéologie des sciences humaines consiste à décrire les conditions discursives de leur émergence, avec une vision critique. L'épistémè moderne se caractérise par un trièdre des savoirs : les sciences mathématiques et physiques, les sciences empiriques et la philosophie. Les sciences humaines ne possèdent pas de domaine spécifique, car elles se sont développées « dans l'interstice de ces savoirs ». Dans une perspective propre au structuralisme symbolique, l'auteur y affirme qu'aucune oeuvre n'existe par elle-même, c'est-à-dire en dehors des relations qui l'unissent à d'autres oeuvres. C'est pourquoi il propose d'appeler « champ de possibilités stratégiques », le « système réglé de différences et de dispersions » à l'intérieur duquel chaque oeuvre singulière se trouve définie.
* 8 Cf. à propos de l'histoire de l'information scientifique et technique (I.S.T domaine qui regroupe l'ensemble des informations produites par la recherche et nécessaires à l'activité scientifique comme à l'industrie), le numéro spécial de la revue Histoire de la recherche contemporaine sur les outils documentaires de la science, tome 10, n° 2, 2021 : https://journals.openedition.org/hrc/6042 et, en particulier, l'introduction par Renaud Fabre ainsi que l'excellent article de Jean-Yves Mérindol, « Brève histoire de l'IST numérique », disponible au lien suivant : http://journals.openedition.org/hrc/6049 dans lequel il montre que les nouveaux processus éditoriaux numérisés révolutionnent la production, la diffusion et le partage du savoir, créant des antagonismes profonds entre l'unification des bases globales de connaissance et les discontinuités de leurs modes d'accès. Cf. aussi l'ouvrage de Valérie Tesnière, Au bureau de la revue : une histoire de la publication scientifique (XIX e -XX e siècle) , Éditions de l'EHESS, 2021, Le Quadrige. Un siècle d'éditions universitaires, 1860-1968 , PUF, 2001, et le guide de la société des auteurs et compositeurs dramatiques (SACD), De 1777 à nos jours. De Beaumarchais à l'ère numérique, plus de deux siècles d'expérience de gestion des droits d'auteur , en ligne : https://www.sacd.fr/200-ans-de-combats-pour-les-auteurs
* 9 Cf. Gaston Bachelard, Le Nouvel Esprit scientifique , PUF, 2008, pp. 16 et 17. Cet ouvrage capital, publié en 1934, démontre que la science crée de la philosophie et permet de penser les conditions de dépassement du couple empirisme-rationalisme, en se situant quelque part entre les deux pôles que sont l'idéalisme et le réalisme.
* 10 En 1710, le Parlement britannique a adopté la première grande loi sur le copyright, the Statute of Anne , dont le nom complet est : An Act for the Encouragement of Learning, by vesting the Copies of Printed Books in the Authors or purchasers of such Copies, during the Times therein mentioned .
* 11 Cf. la contribution de Julien Roche sur la science ouverte dans l'ouvrage coordonné par Marie Cauli, Laurence Favier et Jean-Yves Jeannas, Dictionnaire du numérique , ISTE Editions, 2021.
* 12 Pour son article sur le sujet, Marin Dacos, pionnier de la science ouverte en France, créateur de revues.org et d'OpenEdition, a emprunté la formule nos esse quasi nanos, gigantium humeris insidentes à Bernard de Chartres (XII e siècle) car elle correspond à la logique cumulative incarnée par la science ouverte : « Des nains sur les épaules de géants : ouvrir la science en France », Revue Politique et Parlementaire, n° 1092, 2019. Cf. https://hal.archives-ouvertes.fr/hal-02366604
* 13 Cf. James Mc Clellan, Science Reorganized: Scientific Societies in the Eighteenth Century , Columbia University Press, 1985.
* 14 Cf. Derek Price, Little science, big science and beyond , Columbia University Press, 1986.
* 15 Galilée ou Newton ont, par exemple, eu recours à des techniques de cryptographie pour éviter que leurs travaux ne soient rendus publics. Les découvertes étaient ainsi tenues secrètes jusqu'à ce que l'acceptabilité sociale prédomine et qu'il soit possible d'en tirer profit. Cf. Paul David, « Understanding the emergence of ``open science'' institutions: functionalist economics in historical context », Industrial and Corporate Change, Volume 13, n° 4, 2004 : https://academic.oup.com/icc/article-abstract/13/4/571/718486
* 16 Bien que Newton prétende être le premier à poser les bases du calcul intégral, dès la décennie 1660, il ne publie pas avant 1693, or la première publication de Leibniz remonte à 1684. La publication des découvertes scientifiques conduira à régler la plupart des conflits de ce type puisque l'inventeur dispose d'une preuve de son antériorité, cf. Michael Nielsen, Reinventing discovery: the new era of networked science , Princeton University Press, 2012.
* 17 Dans l'ouvrage précité de Valérie Tesnière, Le Quadrige. Un siècle d'éditions universitaires, 1860-1968 , il est par exemple démontré que les initiatives d'éditions universitaires au début du XX e siècle, y compris le modèle coopératif sans lien institutionnel avec les universités choisi par les PUF, résultent des hausses des tarifs des éditeurs privés : « Le monde des sciences et des lettres s'effraie en effet des hausses jugées prohibitives des prix du papier, de l'impression ; bref, de l'édition. Le malaise des revues et des bulletins scientifiques dont les tirages baissent, la disparition même de certains titres, les refus polis de beaucoup d'éditeurs de publier des manuscrits universitaires : tout évoque un contexte impensable avant 1914 ».
* 18 Cf. Marshall McLuhan, The Gutenberg Galaxy: The Making of Typographic Man , University of Toronto Press, 1962. L'écart d'informations transmises entre un support écrit et un support audiovisuel est cependant considérable puisqu'un journal télévisé (pour un temps d'une vingtaine de minutes) communiquerait seulement l'équivalent d'une page d'un journal quotidien d'information. Cf. aussi du même auteur Pour comprendre les médias , Le Seuil, 1968, War and Peace in the global Village , Bantam Books, 1967, et The Global Village, Transformations in World Life and Media in the 21 th Century , Oxford University Press, 1989.
* 19 Marin Dacos, dans l'article précité, relève qu'il a fallu plusieurs siècles et des itérations pour inventer le système de l'édition scientifique qui est, de nos jours, arrivé à maturité. Il a fallu pour cela un processus de formalisation et de structuration, avec des métiers, des acteurs et des formes : l'évaluation par les pairs en double aveugle, la note de bas de page, la bibliographie, le résumé, etc., toutes formes qui n'existaient pas initialement ou sous des formes rudimentaires.
* 20 Sur la notion de mondialisation culturelle, des auteurs comme Manuel Castells, Abram De Swaan, Anthony Giddens et Armand Mattelart peuvent être mentionnés.
* 21 Au sens strict, la représentation des connaissances recouvre les outils et les procédés, sous une forme traditionnelle ou informatique, permettant de représenter et d'organiser le savoir pour l'utiliser et le partager.
* 22 Distincts des logiciels propriétaires, il s'agit d'un logiciel dont l'utilisation, l'étude, la modification et la reproduction par un tiers en vue de sa diffusion sont permises, soit car il relève du domaine public soit car il repose sur une licence « libre » : GNU-GPL, LGPL ou FDL. Le logiciel libre renvoie aussi au mouvement en faveur de ces outils. Il se distingue du mouvement pour l' open source , ou code source ouvert, qui n'est pas nécessairement un logiciel libre et gratuit et ne s'oppose donc pas à l'utilisation de systèmes intégrés combinant logiciels propriétaires et logiciels open source . Dans les faits, la majorité des logiciels open source sont libres, à l'exception des logiciels interdisant les modifications du code (on parle alors de « tivoïsation »).
* 23 Cf. Patrice Flichy, L'Imaginaire d'Internet , La Découverte, 2001 ou Manuel Castells, La Société en réseaux. L'ère de l'information , Fayard, 1996, et, surtout, La Galaxie Internet , Fayard, 2002.
* 24 Cf. Benjamin Loveluck, « Internet, une société contre l'État ? », Réseaux,ý vol. 192, n° 4, 2015. Andrew Russell montre pourtant que l'Internet ouvert, qui a permis de fédérer de nombreux acteurs du réseau, résulta plus d'une volonté politique et d'un contrôle autocratique que du simple laissez-faire, cf. son livre Open Standards and the Digital Age. History, Ideology, and Networks , Cambridge University Press, 2014.
* 25 Cf. le rapport de Mme Valéria Faure-Muntian, député, et MM. Claude de Ganay, député, et Ronan Le Gleut, sénateur, « Comprendre les blockchains : fonctionnement et enjeux de ces nouvelles technologies », n° 584 (2017-2018) : https://www.senat.fr/rap/r17-584/r17-584.html
* 26 Cf. les directives émises par la CNIL en 2020 : https://www.cnil.fr/fr/la-reutilisation-des-donnees-publiquement-accessibles-en-ligne-des-fins-de-demarchage-commercial
* 27 Une étude publiée en 2017 montrait que les éditeurs les plus « téléchargés » seraient Elsevier et Springer Nature. Cf. Bastian Greshake, « Looking into Pandora's Box: The Content of Sci-Hub and its Usage », F1000Research, n° 6,ý avril 2017 https://f1000research.com/articles/6-541/v1
* 28 Cf. Brian Owens « Sci-Hub downloads show countries where pirate paper site is most used », Nature news, 25 février 2022 : https://www.nature.com/articles/d41586-022-00556-y
* 29 Cf. John Bohannon « Who's Downloading Pirated Papers? Everyone », Science, avril 2016 : https://www.sciencemag.org/news/2016/04/whos-downloading-pirated-papers-everyone et Brian Till, Niclas Rudolfson, Saurabh Saluja, Jesudian Gnanaraj, Lubna Samad, David Ljungman et Mark Shrime « Who is Pirating Medical Literature? A Bibliometric Review of 28 million Sci-Hub Downloads », The Lancet, vol. 7, n° 1, janvier 2019 : https://doi.org/10.1016/S2214-109X(18)30388-7
* 30 Cf. l'article précité « Brève histoire de l'IST numérique ».
* 31 Ces licences, alternatives au copyright et au droit d'auteur, ne protègent, au choix, que certains aspects des droits relatifs aux oeuvres. Cf. https://creativecommons.org/licenses/?lang=fr-FR
* 32 Sa célèbre formule « code is law » est tirée du livre Code and Other Laws of Cyberspace , Basic Books, 1999.
* 33 Cette numérisation rétroactive n'est cependant pas encore exhaustive et laisse de côté certaines ressources structurantes dans plusieurs disciplines. Ainsi, les livraisons de L'Année épigraphique tombées dans le domaine public ne sont pas disponibles sur le portail Persée.
* 34 Les mathématiciens, mais aussi les physiciens, les chimistes ou, encore, dans le champ des sciences sociales, les économistes, y ont recours depuis un certain temps, faisant de ces supports une nouvelle forme de la communication scientifique, cf. https://www.insb.cnrs.fr/fr/cnrsinfo/les-preprints-sont-une-forme-recevable-de-communication-scientifique
* 35 Pour Jean-Yves Mérindol, ces réseaux sociaux ont pour cela besoin de constituer des bases de données (notices, articles complets), ce qui les place en rivaux potentiels des plateformes des éditeurs ou des agrégateurs, dont ils moissonnent (avec ou sans leur accord) les données. S'ils ne permettent pas toujours d'accéder au contenu des revues et livres, ces réseaux sociaux, efficaces en matière de référencement, souvent payants, sont très utilisés dans de nombreux domaines.
* 36 Il faut souligner que Researchgate et Academia.edu encouragent le dépôt de textes et tolèrent le dépôt de documents qui ne seraient pas acceptés sur les plateformes institutionnelles.
* 37 Il s'agit d'un élargissement fondamental, en pleine expansion actuellement et qui mériterait des analyses approfondies. Cf. les dépôts de données de la recherche comme DOREL (créé par l'université de Lorraine) ou la plateforme en cours d'élaboration Recherche.data.gouv ainsi que le rapport de notre collègue député Éric Bothorel https://www.vie-publique.fr/rapport/277879-pour-une-politique-publique-de-la-donnee
* 38 Cf. https://www.wri.org/research/implementing-open-data-strategies-climate-action-suggestions-and-lessons-learned
* 39 Cf. l'article de Marin Dacos précité.
* 40 Cf. le texte de la déclaration : https://unesdoc.unesco.org/ark:/48223/pf0000379949_fre
* 41 Les infrastructures de la science ouverte désignent les infrastructures de recherche partagées, virtuelles ou physiques, notamment les équipements scientifiques ou les ensembles d'instruments de base, les ressources cognitives comme les collections, les revues et les plateformes de publication en libre accès, les entrepôts, les archives et les données scientifiques, les systèmes d'information de recherche actuels, les systèmes de bibliométrie et de scientométrie ouverts permettant l'évaluation et l'analyse des domaines scientifiques, les infrastructures informatiques et de manipulation des données ouvertes, permettant l'analyse des données collaborative et multidisciplinaire et les infrastructures numériques. Elles sont nécessaires pour soutenir la science ouverte et répondre aux besoins des différentes communautés en fournissant des services essentiels ouverts et standardisés pour assurer la portabilité, l'analyse et l'intégration des données, de la littérature scientifique et des thématiques scientifiques prioritaires, les gérer et y donner accès, ou favoriser l'engagement communautaire.
* 42 Le dialogue ouvert avec les autres systèmes de connaissances désigne le dialogue entre les différents détenteurs de savoirs, qui reconnaît la richesse des différents systèmes de connaissances et épistémologies, ainsi que la diversité des producteurs de savoirs, dont les savoirs autochtones. Il a pour but de promouvoir l'inclusion des connaissances des chercheurs traditionnellement marginalisés et d'améliorer les relations et les complémentarités entre les différents épistémologistes, l'adhésion aux règles et normes internationales des droits humains, le respect de la souveraineté et la gouvernance du savoir, ainsi que la reconnaissance des droits des détenteurs de savoirs de recueillir une part juste et équitable des bénéfices pouvant découler de l'utilisation de leurs connaissances. Ce dialogue s'articule avec les droits des peuples autochtones et des communautés locales de gouverner et de prendre des décisions en matière de conservation, de propriété et d'administration des données sur leurs savoirs traditionnels ainsi que sur leurs terres et leurs ressources.
* 43 La participation ouverte des citoyens renvoie au fait d'élargir la collaboration entre les scientifiques et les acteurs de la société au-delà de la communauté scientifique, en donnant accès aux pratiques et aux outils qui font partie du cycle de recherche, et en rendant le processus scientifique plus inclusif et accessible à l'ensemble des acteurs de la société qui s'y intéressent, sur la base de nouvelles formes de collaboration et de travail telles que le financement participatif, la production participative et le bénévolat scientifique. La science citoyenne et la participation citoyenne sont à cet égard devenues des modèles de recherche scientifique conduite par des scientifiques non professionnels, en s'appuyant sur des méthodologies scientifiquement valides et souvent en association avec des programmes scientifiques officiels ou avec des scientifiques professionnels, comme en témoignent les plateformes basées sur Internet et les réseaux sociaux, ainsi que les matériels et logiciels libres, en particulier les applications mobiles.
* 44 Cf. François Houllier, « Les sciences participatives en France : état des lieux, bonnes pratiques et recommandations », 2016 : https://www.open-sciences-participatives.org/uploads/img/resources/5b194eb844fd7_rapport-impression-sciences-participatives-fevrier-2016-web.pdf
* 45 Sur l'éducation ouverte et les ressources éducatives libres Cf. https://oerworldmap.org/resource/ et https://fabriquerel.org/rel/ ou, encore, l'étude pour 2021 de Gema Santos-Hermosa, Vanessa Proudman et Paola Corti https://doi.org/10.5281/zenodo.5734980