Science & santé

Les articles scientifiques sur les gènes pleins d'erreurs à cause d'Excel

Repéré par Grégor Brandy, mis à jour le 24.08.2016 à 17 h 05

Repéré sur WinBeta, Slashdot

20% des articles scientifiques sur les gènes pâtissent de conversions automatiques du logiciel.

Excel has crashed... | Salim Fadhley via Flickr CC License by

Excel has crashed... | Salim Fadhley via Flickr CC License by

S'il vous est déjà arrivé de voir Excel modifier certains de vos chiffres après l'application d'une formule mathématique dans un tableur, alors vous allez facilement comprendre ce qui arrive à beaucoup de chercheurs. Selon un article publié par les scientifiques Mark Ziemann, Yotam Eren et Assam El-Osta, Microsoft Excel a également quelques problèmes avec les noms de gènes, a remarqué le site WinBeta, consacré aux informations liées à Windows et Microsoft.

Dans le résumé de leur article publié sur Genome Biology, les chercheurs expliquent que lorsque l'on utilise Excel avec les réglages par défaut. Or «le logiciel est connu pour convertir les noms de gènes en dates et autres nombres avec virgules flottantes. Un scan programmatique de revues scientifiques spécialisées sur la génétique révèle qu'à peu près un article sur cinq comprenant des listes de gènes publiées sous Excel contient des erreurs de conversions de noms de gènes». Ce problème n'est pas nouveau. D'autres chercheurs avaient déjà remarqué ce phénomène en 2004 et, sur Twitter, certaines personnes soulignent que ce problème leur est déjà arrivé.

À titre d'exemple, indiquent-ils, «les symboles des gènes SEPT2 et MARCH1 sont convertis par défaut en “2-Sept” [pour 2 septembre] et “1-Mar” [pour 1er mars]. Les identifiants RIKEN sont convertis en nombre avec une virgule flottante (comme “231009E13” en “2.31E+13”».

En analysant des articles publiés dans dix-huit revues scientifiques (comme PLoS One, Science, ou encore Nature), entre 2005 et 2015, ils assurent que dans les 35.175 fichiers Excel qu'ils ont analysés, ils ont trouvé 987 erreurs de conversions dans 704 articles, mais expliquent qu'ils en ont peut-être raté d'autres.

«Nous avons montré que des erreurs de conversion dans les noms de gènes persistent dans la littérature scientifique, mais elles pourraient être évitées facilement si les chercheurs, les correcteurs, les équipes éditoriales et les curateurs de bases de données restent vigilants.»