Comme vous l'avez certainement remarqué, le Journal Club du mois dernier n'a pas eu lieu. Je sais que vous en êtes profondément affligé(e)s, donc à charge de revanche, j'ai inclus des articles du mois passé. Il y a un peu plus de mots que d'habitude, mais quand on aime, on ne compte pas !
Et parce que vous le valez bien, commençons par PLoS Computational Biology. Le numéro de juin est vraiment sympa et je ne parle pas seulement de la montagne MCMC ci-contre. Dans la section Education, un article concis et compréhensible vous explique comment visualiser et analyser des images 3D. Très brièvement, la Perspective de juin porte sur la contrôlabilité des systèmes cellulaires : vous l'aurez compris, on est en plein dans des considérations dynamiques de la biologie des systèmes.
Trois articles de recherche ont retenu mon attention ce mois-ci. Le papier sur la méthode ProteinHistorian est l'un d'eux. Il s'agit d'un logiciel libre (licence GPL) avec lequel on peut analyser l'origine d'une protéine d'intérêt. Vous fournissez la liste de protéines qui doit servir de base et vous choisissez parmi les quelques algorithmes disponibles pour calculer l'âge évolutif de votre protéine chérie. Les auteurs fournissent non seulement le code source de l'outil mais aussi les âges évolutifs de protéines issues de 32 génomes eucaryotes.
Le deuxième papier de PLoS Computational Biology qui m'a plu est écrit par une personne qui nous lit 🙂 Magali Michaut et Gary Bader explorent les différents résultats lorsque différents jeux de données sont utilisés pour l'inférence d'interactions génétiques. La méthode dont il est question permet ainsi d'extraire ces informations à partir des reconstructions différentes dont on peut disposer et de les utiliser pour améliorer l'annotation de fonctions géniques.
Le troisième et dernier papier parle d'une méthode dont le nom m'a fait rire : MC EMiNEM. Ce dernier n'a rien à voir avec le rap mais permet de cartographier des interactions fonctionnelles entre des protéines ayant des effets pléiotropes sur l'expression génétique. L'exemple ici est le complexe Mediator (pas de lien avec les laboratoires Servier), un élément crucial de la transcription chez les Eucaryotes. Il s'agit d'un monstre protéique : 25 sous-unités, 3 modules principaux et un autre accessoire, le tout lié par une avalanche d'interactions pour la plupart méconnues à ce jour. MC EMiNEM est ainsi utilisé pour décrire certaines de ces interactions : la modularité du complexe est explicitée ainsi que des cascades de réactions hiérarchiques entre les différentes unités. Ce papier semble être le premier à révéler cette dernière propriété fonctionnelle du Mediator.
Vous connaissez déjà mon attachement à Nature Genetics et Nature Biotechnology. Cette édition du JC n'est pas en reste 🙂 Dans le premier de ces deux mastodontes, j'ai beaucoup aimé un article qui démontre comment des séquences spécifiques au niveau des promoteurs eucaryotes influent directement sur la transcription. Dit ainsi, cela n'a rien de spectaculaire : c'est lorsqu'on mentionne qu'il s'agit de séquences poly(dA:dT) connues sous le doux nom de "nucleosome-disfavoring sequences" que je vois vos yeux devenir des pancakes. En quelques mots, les auteurs ont joué à modifier l'organisation de la chromatine — facteur crucial déterminant la fréquence de visite de facteur de transcription — en manipulant ces séquences poly(dA:dT) présentes au sein d'un grand nombre de promoteurs. Cette manipulation se traduit par des modifications quantitatives de l'expression et les résultats ouvrent de belles perspectives en matière d'ingénierie et de "réglage" transcriptomique.
Nature Genetics se concentre également sur une histoire vieille comme le monde : celle de la domestication du maïs. Dans un article de génomique comparative des populations (dûment accompagné par un gros bol de popcorn), on se plaît à découvrir ce que la comparaison de 75 lignées de maïs domestiqué, sauvage et amélioré peut nous raconter en termes d'évolution de traits phénotypiques, des gènes associés et de régulation de l'expression génique. Une vraiment belle illustration de la rencontre entre la bioinformatique et la biologie évolutive.
Côté Nature Biotechnology, j'ai retenu deux papiers assez utiles. Le premier parle de correction d'erreur dans le cas d'assemblage de novo de données brutes issues du séquençage type PacBio. Il s'agit de la technique SMRT (pour "Single Moleculer Real Time sequencing") qui produit des reads de longueurs très variées et surtout beaucoup plus grandes en comparaison avec les techniques de séquençage 2.0 (haut débit) que nous utilisons massivement jusqu'à présent. Le taux d'erreur reste malheureusement très élevé ce qui présente quelques menus inconvénients… Ce papier détaille une méthode de correction testée sur des données de phages, procaryotes et eucaryotes et assurant une amélioration conséquente du processus d'assemblage de ces reads.
Même journal et des gens qui se plaignent du séquençage haut débit en vogue qui produit des reads trop courts pour rendre compte de grands évènements structuraux au sein des génomes. Du coup, ils ont combiné le séquençage 2.0 et le 3.0 pour produire un mélange de données brutes de longueurs différentes. Ils arrivent ainsi à reconstruire deux contigs représentant les 2 chromosomes de la souche de Vibrio cholerae responsable de l'épidémie de choléra en Haïti. Comme la reconstruction ne leur suffisait pas, ils rapportent également un nombre important de corrections faites aux séquences de référence.
Il y a plein de conférences et évènements intéressants dans ce monde, et comme on ne peut pas aller à tous, on apprécie les comptes-rendus. BMC Bioinformatics publie une sélection d'articles de la BioNLP Shared Task 2011.
Enfin, je souhaitais vous signaler quelques revues : il est toujours intéressant de prendre une direction jusque-là inexplorée dans sa recherche… et quel meilleur début qu'une revue ? PLoS Computational Biology explore le retour vers les fondamentaux ou comment en 2012 on inclue les molécules biologiques dans l'étude de l'évolution étant donné nos avancées techniques et technologiques. Côté Nature Reviews Microbiology, vous pouvez partir à la découverte des apports de la métagénomique dans l'approfondissement de nos connaissances sur les dynamiques d'interactions au sein de communautés microbiennes.
Son frère Nature Reviews Genetics nous mène dans le monde de la découverte de gènes candidats impliqués dans des maladies à travers une multitude d'outils bioinformatiques utilisés. Une revue sur un sujet difficile mais extrêmement intéressant vous attend également dans la rubrique "Study designs" : il s'agit de l'utilisation de données d'expression time course dans le cadre de la modélisation de comportements biologiques. Pour ceux et celles qui n'ont jamais eu à se frotter à ce genre de données, je vous recommande vivement non seulement de lire la revue mais aussi de suivre les travaux de son premier auteur (Ziv Bar-Joseph) qui a contribué à beaucoup d'articles de qualité dans ce domaine.
Laisser un commentaire