Ce billet est le premier de notre nouvelle rubrique Journal Club (JC pour les intimes). Le JC est le moment où on parle de papiers récents proches des thématiques de recherche des gens de l'équipe. La bio-informatique n'échappe pas à cette tradition : étant un domaine en constante évolution et passionnante ébullition, un tas d'études et nouvelles méthodes d'analyse est publié régulièrement. Ainsi, mettre certaines d'entre elles en exergue ici nous a semblé une bonne idée.
Bonne lecture ! Et n'oubliez pas : les commentaires sont là pour entamer la discussion et aller plus loin 😉
Un rapide tour des journaux du mois de février 2012 que je suis et qui ont trait à la bio-informatique 🙂
Le monde merveilleux de la chromatine
Ce mois-ci, pas mal de papiers ont parlé de méthodes et outils d'analyse des états de la chromatine. D'abord, une "Correspondence" dans Nature Methods présente ChromHMM : il s'agit d'un outil qui découvre et décrit des états de la chromatine. Plus précisément, il utilise des modèles de Markov cachés (des Hidden Markov Models ou HMM) ce qui est une approche plutôt classique en la matière. Ce qui est intéressant ici c'est qu'on peut non seulement utiliser cet outil pour les découvrir, mais aussi pour caractériser leurs fonctions biologiques et les corréler à des jeux de données fonctionels, et visualiser les annotations au niveau génomique. Plus intéressant encore : il est possible d'analyser les états de la chromatine à travers de nombreux types cellulaires. Le logiciel est en Java ce qui vous permettra de l'utiliser quel que soit votre système d'exploitation. (Note personnelle : je connais vaguement le premier auteur du papier qui est un excellent bioinformaticien et qui a fait quelques logiciels d'analyse assez superbes jusque là. Celui-là ne devrait pas être en reste.)
Dans la veine "outil", si vous êtes un aficionado de Galaxy, il existe désormais le plug-in CHROMATRA pour vous aider à visualiser les taux d'enrichissement en prenant en compte la longueur des gènes (ou l'élément génomique de votre choix) ainsi que des caractéristiques supplémentaires telles que d'éventuelles données d'expression.
Enfin, vous avez quelques papiers intéressants mais d'objet plus restreint dans la section "Gene Regulation, Chromatin and Epigenetics" de Nucleic Acids Research.
Des phages et autres bébêtes
Ce mois-ci, j'ai eu l'agréable surprise de découvrir une quantité non-négligeable de papiers traitant de sujets assez marrants. Ainsi, Bioinformatics publie un article présentant une approche théorique de classification des styles de vie des phages, appelée PHACTS. Les auteurs implémentent une combinaison d'algorithme de similarité et de classificateur de type Random Forest pour déterminer à partir de données de protéomique disponibles si le phage étudié est en cycle lytique ou en lysogénique. Ainsi, l'algo de similarité crée un jeu de données d'entraînement à partir de données déjà connues contenant des annotations sur le cycle de vie lequel sert à entraîner le classificateur. Ce dernier ensuite joue sur les données de votre phage d'intérêt. De façon assez impressionnante, le taux de précision est de 99%. C'est écrit en Perl et R, c'est sous une licence libre, alors mangez-en, c'est bon 🙂
Aussi dans Bioinformatics, un papier très sympa présente une façon de modéliser les réseaux moléculaires d'interactions intra- et intercellulaires. Que ce soit dans le cadre d'organismes multicellulaires ou de communautés microbiennes, ce genre d'approche présente la possibilité d'avoir une véritable image de comment les cellules se parlent. L'exemple dans le papier est avec un modèle murin d'adénocarcinome des poumons. Je vous laisse découvrir, ça vaut le détour !
Dans la catégorie des papiers marrants, j'attire votre attention vers l'étude publiée dans Nature Methods, j'ai trouvé un papier sur les homologies entre les cerveaux humain et primate. Je ne suis pas une fine connaisseuse des techniques de neuro-imagerie, mais de ce que j'ai compris, ils utilisent des visualisations d'IRMf (résonance magnétique fonctionnelle) pour identifier des régions du cerveau répondant au même stimulus dynamique. Plus précisément, ils ont mis des humains et des macaques devant un extrait de 30 minutes du film "Le bon, la brute et le truand" et on enregistré quelles régions "s'allument". L'idée de départ est que les régions homologues du cerveau devraient avoir des activités similaires chez les espèces en question. Malgré toutes les informations insuffisantes et plein de détails à prendre en compte lorsqu'on établit une telle correspondance, la méthode a l'air prometteuse et offre des possibilités très intéressantes pour une étude approfondie du cerveau.
La vie dans les cellules
Toujours dans Nature Methods portant sur l'intégration du facteur "espace" dans la modélisation de la signalisation cellulaire. La représentation classique des réseaux de signalisation est sous la forme de circuits ou de diagrammes connectés. Cette vision est cependant incomplète puisqu'elle ne prend absolument pas en compte la dynamique spatiale cellulaire. En effet, les réactions biochimiques dans la cellule modifient sa forme ce qui a une influence assez directe sur la position dans l'espace des molécules et donc sur la faisabilité d'autres réactions biochimiques.
Quelques méthodes, utilisant des équations différentielles partielles, existent déjà (CompuCell3D, Visual Cell, etc.) qui essayent de prendre en compte la dynamique spatiale mais elles souffrent de quelques insuffisances. Dans le dernier Nature Methods, un papier présente une nouvelle méthode qui implémente une approche hybride. Ainsi, il est d'une part possible de suivre les effets des réactions biochimiques sur la géométrie cellulaire et, d'autre part, de reconstruire les réseaux de signalisation en fonction des changements spatiaux locaux. Cette méthode est accessible via le logiciel Simmune ce qui a pour avantage de proposer une interface graphique accessible pour ne pas freiner les scientifiques "pas à l'aise avec l'informatique" 😉
Point de vue
Et avant d'être accusée d'être un Nature Methods fangirl, je voulais attirer votre attention vers cette "Opinion" sur les heatmaps. Vous en avez peut-être certainement fait quelques-unes, on en voit dans de nombreuses publications : c'est une représentation graphique très pratique et très claire spécialement utile quand on a plein de données d'expression et on veut leur donner une tête potable. Les auteurs pointent donc deux caractéristiques des heatmaps auxquelles il faut porter une attention particulière pour tirer un véritable profit de cette visualisation : les couleurs utilisées (et leurs gradients respectifs) et l'ordonnancement des colonnes et lignes. Avec justesse, les auteurs rappellent qu'il faudrait éviter les colorations rouge et verte (les plus fréquentes tout de même) parce qu'elles rendent le tout illisible pour les daltoniens. Enfin, la méthode de clustering utilisée joue grandement sur ce qu'on peut (#oupas) voir à partir des données en entrée.
Utile et pratique
Last but not least comme on dit en vieux françois, voici rapidement un papier franchement pratique : il introduit MetExtract, un logiciel pour la métabolomique. Si vous avez déjà annoté des spectra de LC/MS, vous allez être content d'avoir cette implémentation sous la main. En sortie, vous avez une liste de valeurs m/z ainsi que quelques détails supplémentaires sur ce qu'il pense avoir détecté. Pour l'instant, MetExtract n'est cependant disponible que pour Windows : on attend sa version sous GNU/Linux avec impatience.
—
Source de l'image : ted_majour sur Flickr
Laisser un commentaire