Découverte :
L'Encyclopédie ENCODE : coup de génie ou coup de pub ?

Vous avez probablement entendu le buzz du web ou remarqué la soudaine augmentation d'articles autour du projet ENCODE (décodage du génome humain et de ses éléments fonctionnels). En 24 heures, il y a eu une quantité invraisemblable de communiqués de presse, billets de blogs et articles grand public dans les médias anglophones (et je passe sur les applications tablette...). La profusion euphorique laisse cependant transparaître quelques hics que je voudrais soumettre à vos yeux et cerveaux bien reposés des vacances et avides de lecture.

Capture d'ecran de la page de l'Encyclopédie ENCODE.

Capture d'ecran de la page de l'Encyclopédie ENCODE.

De quoi s'agit-il au juste ? Eh bien, la revue Nature a lancé l'Encyclopédie ENCODE, une ressource en ligne permettant d'explorer la quantité impressionnante de données du projet ENCODE. Je ne vais pas me lancer dans le résumé et la discussion de la trentaine d'articles comme celui-ci publiés d'un coup. J'imagine que le lectorat de ce site n'a pas non plus besoin d'une mise en garde contre les promesses mirobolantes, science-fictionesques et pas vraiment tenues du génome humain. Les papiers sont excellents, à accès ouvert. L'Encyclopédie est jolie et fournit une façon assez nouvelle et agréable d'explorer la mine de données qu'est ENCODE. Ne pas reconnaître les efforts et les avantages incontestables de l'initiative serait faire preuve de mauvaise foi (au mieux).

Soit. J'aimerais qu'on s'arrête à quelques petites choses gênantes cependant. Je ne suis pas spécialement fan des théories du complot, mais il est surprenant de constater que ces publications massives, censées apporter une connaissance hors pair et LA réponse à la question ultime, apparaissent à deux mois de l’élection présidentielle américaine. Oh, beaucoup vont se dire que sincèrement, on se fiche royalement de la politique américaine et d'éventuelles magouilles politiciennes. Vous avez raison de sauter ce paragraphe alors 🙂 Permettez-moi de continuer pour les autres : ENCODE constitue un financement de 5 ans à la hauteur de 200 millions dollars US, subside accordée aux National Institutes of Health (NIH). De plus, comme le souligne l'un des piliers du projet Ewan Birney :

Funders have considerable influence in how raw and analysed data are released, and should design policies that maximize reuse. Early data-release policies focused on how data should be shared before publication, with clumsy etiquette-based restrictions on the first publications of global analysis, such as waiting for the authors who generated the data to publish their analyses before others can publish on the entire data set. These agreements are starting to show their age and a lack of clarity.

The new era of analysis calls for a rethink, with more focus on the release of intermediate analysis throughout the project, so that the community can use the resource more fully during the project; the 1000 Genomes consortium has done well in this regard.

En français, ça discute très diplomatiquement de l'influence de celui qui donne les sous sur la façon dont les résultats de recherche sont rendus publics. J'imagine bien les sourires acides en coin d'une bonne partie de nos lecteurs 😉 On ne connaît ça que trop bien. D'ailleurs, Daniel MacArthur de Genomes Unzipped renchérit en disant qu'une bonne partie des données d'ENCODE étaient prêtes pour l'analyse il y a déjà un an. Nous avons encore plein de pain sur la planche pour nous rendre indépendants des contraintes politiciennes et des peurs de moins en moins justifiées (et toujours irrationnelles) de cacher nos découvertes pour qu'on ne nous les vole pas...

Comme promis, je m'arrête ici pour la politique. Parlons science. J'ai lu avec beaucoup d'intérêt que "80% du génome humain est fonctionnel". J'aurais aimé également lire de quelle(s) fonctionnalité(s) il s'agit exactement. Il y a un chiffre qui circule disant que 1,5% du génome code pour des protéines ; Ed Yong souligne que selon les papiers ENCODE, 8-9% du génome seraient réservés à des sites de fixation de facteurs de transcription. Si on étend ça à tous les types cellulaires, on peut pifométriquement conclure à 20% du génome. Alors, pour aller jusqu'à 80%, il y a de la marge. Ewan Birney parle justement de ça sur son blog ; l'étiquette "functional" peut être apposée sur plein de choses dans le sac de l'activité biochimique mesurable, donc un bric-à-brac à prendre avec des pincettes :

Pragmatically, in ENCODE we define our criteria as “specific biochemical activity” – for example, an assay that identifies a series of bases. This is not the entire genome (so, for example, things like “having a phosphodiester bond” would not qualify). We then subset this into different classes of assay; in decreasing order of coverage these are: RNA, “broad” histone modifications, “narrow” histone modifications, DNaseI hypersensitive sites, Transcription Factor ChIP-seq peaks, DNaseI Footprints, Transcription Factor bound motifs, and finally Exons.

Pour les très pessimistes, même ces 20% peuvent paraître de trop. Birney parle donc de l'importance de fixation (de facteurs) biologiquement neutre en termes d'évolution, à préférer pour lui à "bruit biologique". L'idée est que des évènements de fixation de facteurs de transcription se produisent de façon neutre, c.-à-d. sans être sujets à une sélection positive ou négative ou, de façon profane, dont "l'évolution se fiche" (oui, je sais, je viens d'écrire des gros mots 🙂 ). Après, ça discute de sélection négative et du choix des 80% : je recommande la lecture de ces paragraphes que je ne résume pas ici pour me laisser de la place pour la suite 🙂

L'autre point que j'aimerais bien aborder avant de terminer cette bafouille est l'utilisation à outrance du ton sensationnaliste et du mot "ADN poubelle". Exemples :

The hundreds of researchers working on the ENCODE project have revealed that much of what has been called 'junk DNA' in the human genome is actually a massive control panel with millions of switches regulating the activity of our genes. (clame Eurekalert)

Now scientists have discovered a vital clue to unraveling these riddles. The human genome is packed with at least four million gene switches that reside in bits of DNA that once were dismissed as “junk” but that turn out to play critical roles in controlling how cells, organs and other tissues behave. The discovery, considered a major medical and scientific breakthrough, has enormous implications for human health because many complex diseases appear to be caused by tiny changes in hundreds of gene switches. (jouit le New York Times)

Des danseuses faisant des figures du genre double hélice lors de la conférence de presse de lancement de l'Encyclopédie ENCODE. Image : Nature.

Des danseuses faisant des figures du genre double hélice lors de la conférence de presse de lancement de l'Encyclopédie ENCODE. Image : Nature.

Au risque de faire la rabat-joie de service, ça fait un moment qu'on a arrêté de parler d' "ADN poubelle". Même que des gens totalement fous ont magnifiquement théorisé à quoi et comment ces parties du génome pourraient servir... dans les années 1960-70. Alors, c'est sûr, ce n'est pas la faute au projet ENCODE si la presse grand public prétend à chaque fois que les scientifiques ont encore une fois sauvé le monde. Mais massivement utiliser le genre de rhétorique "on vient de découvrir les ultimes secrets du génome humain grâce à ce projet" relève de la malhonnêteté intellectuelle et gratifie quelque initiative qui n'a pas à recevoir ce tribut puisqu'ENCODE n'a pas prouvé que l' "ADN poubelle" est utile...

Voici que la presse française s'est saisie de la question :

  • 'Projet ENCODE : nouvelles révélations sur l'ADN' (Le Point) : "La molécule de l'hérédité se révèle bien plus complexe qu'un simple catalogue de gènes... Des chercheurs ont percé l'un de ses secrets. [...] Puis, plus tard, peut-être les scientifiques finiront-ils par percer le mystère des 20 % d'ADN restants, que nous ne nous empresserons pas de taxer d'inutile..."
  • 'Vers la fin de l' "ADN poubelle" ' (Le Monde). C'est une édition "abonnés" à laquelle je n'ai pas accès pour y piocher des phrases croustillantes, désolée.
  • ' "ADN poubelle" : une fonction biologique sous-estimée' (Maxisciences) : "Dans le cadre du Human Genome Project, les scientifiques ont établi que cet ADN comptait quelque 22.000 gènes. Cette découverte avait alors poussé les chercheurs à momentanément laisser de côté le reste du génome, l'ADN non codant. Jugé à l'époque plutôt inutile, ce dernier avait alors été rebaptisé "ADN poubelle". Mais de plus en plus de recherches semblent démontrer que ce surnom est tout sauf adapté."
  • 'L' "ADN poubelle" essentiel à tout être humain' (L’Essentiel, Luxembourg) : "Cet ADN poubelle serait en fait une table de contrôle gigantesque, avec des millions d'interrupteurs régulant l'activité de nos gènes en déterminant si ceux-ci doivent être «allumés» ou «éteints», font savoir mercredi les universités de Genève et de Lausanne, toutes deux impliquées dans le projet international ENCODE."
  • Si vous ne me croyez pas ou peinez toujours à comprendre ma douleur, voyez ce doux titre " "L'ADN poubelle" joue un rôle essentiel dans l'activité des gènes" lancé par AFP, repris par Science et Avenir, TV5Monde, Romandie, Libération, La Croix, France24, RTL.be, 20 Minutes, Medisite... et j'en oublie certainement.
  • Le meilleur pour la fin... J'ai particulièrement aimé ' Une nouvelle vision du génome bouleverse la biologie ' (Gizmodo) : "Depuis une décennie, les chercheurs supposent que sur 20 000 gènes, seuls 2% sont indispensables à la biologie humaine. Voici donc dix ans d’erreur ?" Et ils terminent : "La communauté scientifique en reste coi, il faut dire que cette nouvelle vision bouleverse la biologie pour de bon. Quoi qu’il en soit c’est un challenge supplémentaire, les biologistes vont être occupés pendant un certain temps !"

J'en reste coite, moi aussi... Les scientifiques n'ont en général pas de prise sur la communication, les "éléments de langage", l'engrenage des relations publiques, et c'est bien dommage. Les articles, les données, l'Encyclopédie, etc, sont des productions superbes. L'hystérie sensationnaliste les cache et nuit autant à la communauté scientifique qu'au grand public, intéressé et curieux d'en apprendre toujours davantage.

Et pour ne pas finir sur un ton défaitiste, je vous invite à parler davantage de ce que vous faites (et ne faites pas) en science 🙂 Oui, discutez de votre travail sur les pages de Bioinfo-Fr !

---

L'image des danseuses est disponible en plus grand format sur la page Facebook de Nature. Merci à Yoann M., Guillaume Collet et Aurélien C. pour la relecture 🙂

  • À propos de
  • Thésarde biologie évolutive et bio-info // Geek // Auteure chez Global Voices Advocacy, FutureChallenges.org, LinuxFr.org & Intidar // Editrice chez Global Voices en bulgare // Bloggueuse scientifique pour Urban Times Science, Science 3.0 // Part-time research assistant for UNESCO // Chaire groupe de travail international "Women in Science & Tech" auprès de l'Institut Destrée avec l'UNESCO // Je suis sur Twitter (parfois) https://twitter.com/#!/MaliciaRogue

22 commentaires sur “L'Encyclopédie ENCODE : coup de génie ou coup de pub ?

  1. Il y a en effet plusieurs \'problèmes\' dans ce projet et sa dissémination :

    - le rapport qu\'en font les médias de masse. On sait bien qu\'il faut des titres accrocheurs et provocateurs pour attirer l\'oeil du lecteur \'non-initié\'. Et puis une majorité de journalistes qui reportent l\'info ne sont pas de formation scientifique et répète simplement le communiqué de presse officiel.

    Rien que le communiqué officiel laisse à désirer : ENCODE scraps the junk (http://www.eurekalert.org/pub_releases/2012-09/embl-fff083112.php). Après il ne faut pas s\'étonner que les médias de masse s\'emballent.

    Et puis justifier 200 millions de dollars de dépense quand la planète est en crise en disant simplement qu\'un consortium scientifique a généré des données intéressantes pour la communauté, c\'est pas sexy.

    - Je suis plus sceptique sur la date de l\'annonce en rapport avec les élections mais c\'est clair qu\'il y a un grand décalage (papiers soumis fin 2011, acceptés mai 2012, disponibles septembre 2012).

    - Pour les 80% fonctionnels, c\'est pour moi purement un débat stérile. Le consortium n\'aurait en effet pas du sortir de chiffre. En biologie on sait depuis pas mal de temps que notre génome génère des milliers de transcrits non codants qui pourraient jouer un rôle régulateur. Le fait que l\'ADN poubelle ne soit pas poubelle n\'est pas vraiment une découverte (en tout cas pour les \'initiés\').

    - Il fut donc relativiser les résultats ENCODE. C\'est une mine d\'informations incroyables pour tout biologiste s\'intéressant à ces problématiques. Mais cela reste de l\'analyse bi-informatique et probalistique qui suggère qu\'une énorme protion de notre génome pourrait avoir une \'fonction\'. C\'est aux centaines de labos dans le monde de reprendre les données en profondeur pour tester et valider, ou invalider, toutes ces prédictions.

    Alexis, chercheur CNRS.

    • Merci pour votre commentaire détaillé qui contribue beaucoup de matière à réflexion pour la remise des pendules à l\'heure. Excellente journée 🙂

      • De rien.

        Pour alimenter le débat, à lire cet édito de Brendan Maher dans Nature blog (http://blogs.nature.com/news/2012/09/fighting-about-encode-and-junk.html) présenté de manière humoristique sur twitter par Stephen Curry : ENCODE project reveals that 80% of press releases are junk…

    • Je voudrais juste préciser ici que les annotations ENCODE *ne sont pas* des prédictions mais de vraies données expérimentales produites par des biologistes. Evidemment, il a fallu un paquet de bioinformaticiens pour analyser l\'énorme quantité de données, mais elles n\'en restent pas moins réelles!
      extrait du papier principal, section Methods: The elements mapped (and approaches used) include RNA transcribed regions (RNA-seq, CAGE, RNA-PET and manual annotation), protein-coding regions (mass spectrometry), transcription-factor-binding sites (ChIP-seq and DNase-seq), chromatin structure (DNase-seq, FAIRE-seq, histone ChIP-seq and MNase-seq), and DNA methylation sites (RRBS assay)

      • Merci pour votre commentaire. Je voudrais savoir : où est-ce qu\'on a dit que ce n\'était pas de vraies données ? Ce n\'est pas du tout ce qui est discuté ici, mais c\'est la pertinence de certaines interprétations et le traitement médiatique associé.

        • Je ne parlais pas de votre post ! Très bonne analyse des médias français par ailleurs.
          Je répondais au commentaire d\'Alexis Verger, qui se termine par \"pour tester et valider, ou invalider, toutes ces prédictions\".
          Désolée pour la confusion...

  2. Excellent, merci. J\'espère qu\'on verra une couverture d\'ENCODE au moins équivalente à celle de Higgs sur la blogosphère francophone.

    Amusant que tu ais choisi le même exemple que moi (http://toutsepassecommesi.cafe-sciences.org/2012/09/07/encode-la-revanche-du-retour-du-fils-du-genome-humain/) en saisie d\'écran de Nature. Ca montre un certain biais dans nos intérêts...

    • Merci pour ce billet, superbe ! Sinon, je plaide coupable pour le biais très fort que tu as remarqué pour les captures d\'écran 🙂

  3. Effectivement j\'ai été surprise en lisant mes flux RSS hier...
    « Non, l’ADN ne contient pas que des gènes, affirme le programme Encode ! » (Futura-Sciences, http://www.futura-sciences.com/fr/news/t/medecine/d/non-ladn-ne-contient-pas-que-des-genes-affirme-le-programme-encode_41066/)

    Sans blague ?!

    • Merci pour votre réaction, j\'avais raté celui-ci... J\'ai essayé de ne pas abuser du sarcasme et de ne pas mordre trop fort, mais c\'est affligeant. J\'aimerais bien attirer l\'attention sur ces 2 papiers que j\'ai cités dans le billet mais j\'insiste lourdement là, au vu de l\'hystérie pseudo-scientifique :
      \"Gene Regulation for Higher Cells: A Theory\" https://www.sciencemag.org/content/165/3891/349.long (1969)
      et \"Evolution at two levels in humans and chimpanzees\"
      https://www.sciencemag.org/content/188/4184/107.long (1975).

  4. Illumina comme illuminati !?...\'

  5. [...] à jour : excellent compte-rendu qui couvre certain des mêmes points, et d’autres, par Malicia sur bioinfo-fr.net. [...]

  6. [...] et a eu le don d’irriter une bonne partie de la communauté scientifique (comme ici ou ici pour les francophones). Petit [...]

  7. Cela veut dire que notre ADN est le résultat d’un code réfléchi …
    il y aurait donc un programmeur ?
    comme a dit Voltaire
    “L’univers m’embarrasse, et je ne puis songer
    que cette horloge existe et n’ait pas d’horloger.”
    nous ne devons pas oublier que nous sommes des créatures et qu’il y a un créateur qui nous aime

    • Vous avez vos points de vue, nous avons les nôtres. Je vous répond à mon tour avec une citation:
      \"La science et le Christ n\'ont rien à voir l\'un avec l\'autre, sinon dans la mesure où l\'habitude de la recherche scientifique enseigne la prudence au moment d\'accepter une preuve quelle qu\'elle soit. En ce qui me concerne, je ne crois pas qu\'une révélation ait été faite. Face à la question de l\'au-delà, il appartient à chacun de tirer ses propres conclusions, à partir de probabilités vagues et contradictoires.\"
      (Charles Darwin - juin 1879)

      Pour ma part, voici ce en quoi je crois:
      \"En tuant le hasard, on ne ressuscite pas Dieu.\"
      (Jean Rostand / Inquiétudes d’un biologiste)

  8. [...] of “junk DNA” just got a bit on my nerves. I’ve written about this elsewhere, so would prefer to skip it here and focus on the ultimate honour for people like me (i.e., [...]

  9. Pourquoi cette tempête quand ce n\'est pas la première fois qu\'un article est répété, amplifié, modifié par les journalistes quand certains ne peuvent même pas reporter une actualité simple sans titre accrocheur. Je veux dire, come on, depuis quand 20 minute ou gizmodo-fr sont des sources pour quelque chose de sérieux ?

    Concernant le coté politique, là aussi rien d\'inédit, et même pas besoin de financer dans certains cas (e.g. retardement de publication d\'articles de cryptographie par la NSA etc.).

    La grande question, ayant de forte attente de ce blog, est :
    Au final, à quoi sert cette article avec tant de politique, de pointage de doigt et aussi peu de contenu informatif ?

    • Merci pour votre commentaire.

      Vous demandez : \"Je veux dire, come on, depuis quand 20 minute ou gizmodo-fr sont des sources pour quelque chose de sérieux ?\" <<< Mmmmm, depuis qu'une grande partie des non-scientifiques les lisent ? Et, come on, depuis quand vous ignorez avec autant de mauvaise foi le reste d'articles que j'ai cité ? Ou devrais-je demander : depuis quand AFP, Le Monde, Libé, etc. sont des sources pour quelques chose de sérieux ?

      "Au final, à quoi sert cette article avec tant de politique, de pointage de doigt et aussi peu de contenu informatif ?" <<< Au final, à quoi sert votre commentaire avec tant d'animosité, de mauvaise foi et de critique non constructive ? 🙂

      • Okay, je suis d\'accord j\'ai trop résumé :
        Comme dans un journal de psychologie où on ne peut pas compter tomber sur des articles approfondi de bioinfo, oui, sur 20min, Libé, le Monde, il ne faut pas compter avoir des articles précis, correctes et approfondi sur la science.

        Il n\'y avais pas d’animosité.
        Quant à l\'utilité, je pense que c\'est bon, il a servi.

        • Je ne suis pas d\'accord sur le coup du \"journal de psychologie\" et je trouve que c\'est un début de troll sciences humaines inférieures aux sciences dures 😉

          La question n\'est pas de chercher de la précision ou de l\'approfondi dans une presse grand public. La question est d\'y chercher des choses correctes. Je ne vois absolument aucune raison de devoir accepter des contre-vérités quand il s\'agit d\'un article de vulgarisation scientifique. Si on extrapole votre position, on devrait accepter des faits incorrects portant sur des résultats sportifs ou des évènements historiques sous le seul prétexte que c\'est un journal \"grand public\" qui les publie.

          Dénoncer le manque de correction est nécessaire, voire même requis quand on le peut. Après tout, nous sommes les gens avec l\'expertise scientifique approfondie et nous avons une certaine obligation envers nos concitoyens non-scientifiques de les engager dans une démarche de lecture critique plutôt que de passivement les laisser manger la soupe au lait d\'éditorialistes peu scrupuleux.

          Je ne suis pas sûre de comprendre votre \"quant à l\'utilité, il a servi\" par contre.

  10. J\'aimerais réagir sur cette phrase :
    \"Au risque de faire la rabat-joie de service, ça fait un moment qu’on a arrêté de parler d’ « ADN poubelle ».\"

    Je ne suis pas tout à fait d\'accord avec toi Malicia. Oui certe on sait depuis longtemps que cet ADN dit poubelle n\'est pas si inutile qu\'il en a l\'air, mais le terme lui est resté. Rien qu\'un petit tours sur Pubmed et tu verras qu\'on en parles toujours (pas seulement à cause d\'ENCODE). Sur mon bureau traine depuis un bon moment un papier intitulé \"A brief history of the status of transposable elements: from junk DNA to major players in evolution.\" et il date de décembre 2010. On en parle toujours donc, mais certes plus dans le même contexte. ENCODE ne fait que continuer dans ce sens.

    En ce qui concerne la presse française, ils reprennent tout simplement des termes employés par les scientifiques eux-mêmes. Après, il faut mettre aussi dans la balances que des sites comme gizmodo, 20 minutes etc... écrivent des articles à chaud, sur des sujets qu\'ils ne métrisent pas, et que donc dans tout les cas il faut prendre aves des pincettes. Je pense que chacun est assez responsable et éclairé pour aller voir des sites plus ciblés sur le sujet s\'ils veulent en savoir plus. Après, que l\'on titre \"ça va révolutionner le travail des chercheurs en biologie\" ou bien \"on le savait déjà mais on commence à approfondir et à mieux comprendre\", forcément... ça a un impact sur les ventes! Croire qu\'un journal est une source d\'information objective et pertinente c\'est ce mettre le doigt dans l\'oeil jusqu\'au coude.

  11. [...] ses résultats en septembre. J’en avais causé ici, et il y avait aussi un bon billet sur le blog bioinfo-fr. Comme discuté à l’époque, l’affirmation selon laquelle 80% du génome était [...]

Laisser un commentaire