Manque de reproductibilité
J.P. Ioannidis : problème d’expérimentations => résultats faux
Fraude dans la recherche: comment la détecter ? Comité d’enquête => perte de crédibilité dans la recherche et la science.
- Dong-Pyou Han (2013) : 57 mois de prison, 7.2 million de dollar d’amende, 1 article retiré
- Dierik Stapel (2011) : 58 articles retirés
- Brian Wansink (2016) : 17 articles retirés
Conséquences des mauvaises pratiques scientifiques
- Reinhart et Rogoff (2010): politiques d’austérité, fichier excel pourri, méthodes pas claires. Point positif cela a con
Mauvaise science délétère: soutient des politiques néfastes, affecte la vie des gens, frontière brouillé entre science et excroquerie, favorise les théories du complot
Crise de la crédibilité ?
Ces problèmes ont toujours existés. Beaucoup plus de publications mais aussi beaucoup plus de rétractations.
Difficultés à reproduire des études passées, tout domaine confondu.
Plusieurs causes:
- raisons sociales : conflits d’intérêt, manque d’incitation à reproduire son propre travail.
- causes méthodologiques et techniques: biais, mauvais design, analyse faible, rapport faibles, manque d’information, code source non disponible
Karl Popper (1934): notion de falsifiability et de crucial experiment, les bonnes expérimentations permettent de discriminer les bonnes des mauvaises théories. Les occurrences uniques non reproductibles n’apportent rien à la science : problème c’est un idéal pas un norme: évènements extrêmenent rares en astronomie, études comportementales
Reproductibilité : un valeur centrale de la sceince
Universalité : Reproductibilité agit comme un moyen de contrôle, d’évaluer la robustesse.
Incrément : la science se construit aussi sur le travail de tous, y compris les erreurs. La reproductibilité permet de réaliser un contrôle qualité.
Les pratiques scientifiques ont évalos avec l’arrivée des ordinateurs - Ben Marwirk (2015)
How computer broke science
Geoffrey Chang : erreur de programmation dans un script utilisé dans plusieurs labos. 5 articles retirés. Pousse la communauté à améliorer les pratiques de génie logiciel.
L’utilisation de tableur généère des problèmes: encodage des données, limites des logiciels (pertes de données COVID) Boite noire statistiques problèmes de statbilité numérique et d’environnement logiciel.
Les soucis de reproductibilité varient selon le domaine
- problèmes méthodo, stats en SHS, cancérologie
- ingénérie logicielle, reproductibilité computationnelle en génétique
- mécanique des fluides : problèmes numériques
Articlespubliés : uniquement résultats positifs mais pas de publication des échecs, des impasses
Recherche reproductible: combler l’écart entre chercheur et lecteur par plus de transparence.
Première apparition de reproductible research
Claerbout & Karrenbach (1992)
Reproductibilité, réplicable, robustesse, généralisation
reproductibilité expériementale : mêmes données, mêmes protocole : résultat similaire
reproductibilité statistiques : même daonnées, même analyse:
reproductibilité computationnelle : même donnée, même code, même environnement : résutlats exactement identique
Outils existants, standards existants
- notebook et workflow
- environnement logiciels
- plateforme de partage (github/gitlab/ zenodo/ HumaNum)
Bonnes pratiques
N°1 - prendre des notes et documenter
Document computationnel / progammation lettrée
Du code doit être lisible par une machine mais aussi un humain.
Outils : Jupyter notebook, Emacs Org-mode, Rstudio
Carnet de laboratoire et article reproductible
Documenter: - les hypothèses - les expérimentations - l’analyse initial et/ou l’interprétation des expérimentations - organisation: garder trace des choses à faire, faites, à tester, améliorer
Workflows
Les notebooks ne sont pas la panacée: ils peuvent devenir rapidement confus et n’incitent pas à faire du code propre
Les workflows découpent le code en sous-parties qui exécutent une petite tâche
Workflows: - meilleur vision - code composition et mouvement de données
Outils de workflow - Gnu Make - Galaxy, kepler, Taverna, Peagsus - R target, - léger : drake, swift, snakemake (make en python) - hybrid: SOS-notebook
N°2 Contrôler l’environnement logiciel
- environnement logiciel qui évolue
- dépendance à la version du logiciel ou du système d’exploitation
- impact du compilateur
Challenge reScience : reproduire une étude de plus de 10 ans
Complexité des écosystèmes
Matplotlib: - dépendances Python - dépendances système non visibles
Ecosystèmes non standards
Outil peu accessible
- documenter son usage
- si installation trop compliquée, les gens ne vont pas l’utiliser
Gestionnaire de conteneur et de paquets
- good : Guix
- bad : Docker, singularity
- ugly : ReproZip
Conteneur: - pour : léger, bonne isolation, facile à utiliser - contre : opaque (image binaire déjà faite), n’est pas prévu pour faire de la reproductibilité (orienté admin-sys)
- Gestionnaire de paquet propres aux langages pip/pipenv/virtualenv, conda, CRAN/Bioconductor
- GUIX/NiX: Gestionnaire de paquet fonctionnels, excellent isoloation, bon reproductibilité
N°3: gestion des versions et forges logicielles
Git
- outil de version de code
- développé depiuis 2005 par Linus Torvalds
- fonctionnement local avec possibilité de navigation poussées
-
distribué : tout le monde a une pleine copie de l’historique
Github, Gitlab et autres
- hébergement gratuit de logiciels libres
- interface web agréable
- gestion des utilisateurs et des droits
- issues, intégration continue
Attention la pérennité n’est pas garantie ! Cela permet de collaborer mais pas archiver.
Archives
- Articles: arXiv.org, HAL
- données: Zenodo (CERN, licence libre d’utilisation), figshare
- logiciels: Software Heritage
Changer la façon de produire de la recherche
Changer les pratiques de recherche
Software Carpentry, The Turing Way
Changer les pratiques de publication
Evaluation des artéfacts et badges ACM
Conférences majeures: en mode open review, prix de l’article le plus reproductible, challenge de reproductibilité
Chnager les pratiques académiques
Mettre fin au Publish or perish
Publications de reproduction d’articles
Arrêter la prise en compte de l’impact factor
Plan National pour la Science Ouverte
Piliers principaux: - Open Access - Open Data - Open Source - Open Methodology : recherche reproductible (notebooks ouverts, infrastructures scientifiques ouvertes) - Open peer review : éviter les collusions - Open eductional ressources
Resources
- guide de la recherche reproductible
- MOOC Recherche reproductible
- à venir MOOC RR avancé => 2022
- contrôle de l’environnement logiciel
- workflow scientifique
- gestion des données