Reconstruction automatique de réseaux métaboliques

Le nombre de génomes séquen­cés croît aujourd'hui expo­nen­tiel­le­ment. Il est pro­bable que d'ici peu de temps cha­cun d'entre nous puisse avoir la séquence de son propre génome pour une poi­gnée de dol­lars en quelques jours seule­ment. On peut d'ailleurs se réfé­rer à ce récent débat vidéo, dans lequel inter­vient notam­ment le pro­fes­seur Denis Duboule (géné­ti­cien à l'École Poly­tech­nique Fédé­rale de Lau­sanne), pour avoir plus d'informations au sujet des séquen­çages haut débit, des risques que cela com­porte pour cha­cun d'entre nous, des pré­cau­tions à prendre vis-à-vis du "tout séquen­çage".

Du point de vue de la recherche, de très nom­breux orga­nismes sont aujourd'hui séquen­cés à la chaîne. Ces séquen­çages haut débit apportent une quan­ti­té d'information énorme qu'il convient ensuite d'étudier, et notam­ment une infor­ma­tion sur le méta­bo­lisme d'un orga­nisme via l'identification des enzymes pré­sentes dans les cel­lules. Et la recons­truc­tion de réseaux méta­bo­liques (n'ayez crainte, je vous expli­que­rais plus loin de quoi il s'agit) est un excellent moyen de prendre en compte cette grande quan­ti­té d'information.

Une pre­mière étape logique après un séquen­çage consiste en l'annotation du génome. Bien qu'il s'agisse là encore d'un tra­vail de bio­in­for­ma­ti­cien et qu'il est indis­pen­sable à la créa­tion de réseaux méta­bo­liques, ce n'est pas l'objet pre­mier de cet article et je n'entrerais donc pas dans les détails de l'annotation d'un génome (mais nul doute que l'annotation de génomes fera un jour l'objet d'un article sur ce blog). Non, ce qui va nous inté­res­ser ici c'est ce que l'on peut faire une fois que l'on est en pos­ses­sion d'un génome anno­té. Quelles connais­sances peut-on en tirer ? Quels sont les apports en bio­lo­gie ?

Mais avant de répondre à ces ques­tions, il convient de répondre à une pre­mière : qu'est-ce que l'annotation d'un génome ? Et bien c'est très simple, l'annotation d'un génome consiste en l'attribution pour chaque gène de sa fonc­tion au sein d'une cel­lule. On a ain­si une liste de gènes asso­ciés à leur fonc­tion pour un orga­nisme don­né. Et c'est cette liste de gènes que l'on va uti­li­ser pour mieux com­prendre le fonc­tion­ne­ment d'un orga­nisme dans sa glo­ba­li­té, en recons­trui­sant son réseau méta­bo­lique.

 

Un exemple de réseau métabolique. Image par l'auteur
Un exemple de réseau méta­bo­lique. Image par l'auteur

Un réseau méta­bo­lique ? Késa­ko ?

Un réseau méta­bo­lique, c'est le regrou­pe­ment de l'ensemble des pro­ces­sus chi­miques et phy­siques qui déter­minent la phy­sio­lo­gie d'une cel­lule. Il com­prend l'ensemble des réac­tions chi­miques inter­ve­nant dans le méta­bo­lisme de cette cel­lule, l'ensemble des réac­tions de trans­port mais éga­le­ment les régu­la­tions qui inter­viennent au niveau de ces réac­tions.

Et com­ment recons­truire un tel réseau à par­tir d'un génome anno­té ?

Il y a habi­tuel­le­ment deux grandes étapes dans la recons­truc­tion d'un réseau méta­bo­lique. La pre­mière, la plus rapide, consiste à prendre le génome anno­té et de regar­der pour chaque anno­ta­tion, com­ment on pour­rait ajou­ter telle ou telle infor­ma­tion dans notre réseau. On obtient ain­si un "draft" méta­bo­lique, c'est-à-dire un réseau brut, de qua­li­té variable (et direc­te­ment dépen­dante de la qua­li­té de l'annotation du génome) et pou­vant être amé­lio­ré.

La seconde étape consiste d'ailleurs en l'amélioration de ce draft méta­bo­lique. Elle pour­ra se faire à la main, des experts de l'organisme étu­dié pou­vant se concen­trer sur cer­taines voies méta­bo­liques impor­tantes, ou elle pour­ra se faire en uti­li­sant des tech­niques par­ti­cu­lières dites de gap-filling ("rem­plis­sage de trous"). Dans cet article, je ne vais vous pré­sen­ter que la pre­mière des deux étapes, la seconde étant un domaine si vaste qu'il pour­ra faire l'objet d'un ou plu­sieurs articles ulté­rieurs sur ce blog.

Pour la pre­mière étape, consis­tant donc à pro­duire un pre­mier réseau méta­bo­lique à par­tir de la seule infor­ma­tion du génome anno­té, dif­fé­rents outils existent. Je vais vous pré­sen­ter celui que je maî­trise le mieux et qui semble être le plus uti­li­sé par la com­mu­nau­té : Path­way tools, déve­lop­pé par l'équipe de bio­in­for­ma­tique de SRI inter­na­tio­nal.

Le fonc­tion­ne­ment glo­bal de Path­way tools (et plus pré­ci­sé­ment de Patho­Lo­gic, la par­tie de l'outil per­met­tant de recons­truire des réseaux méta­bo­liques) est assez simple à com­prendre. Comme je vous l'ai dit, il prend en entrée un génome anno­té. Dans ces anno­ta­tions, on va notam­ment avoir les anno­ta­tions des gènes enzy­ma­tiques. Ces gènes enzy­ma­tiques sont habi­tuel­le­ment asso­ciés à un numé­ro EC cor­res­pon­dant à une clas­si­fi­ca­tion inter­na­tio­nale des enzymes. À chaque numé­ro EC cor­res­pon­dra une réac­tion enzy­ma­tique don­née. Path­way tools va faire cor­res­pondre ce numé­ro EC (ou à défaut de numé­ro EC, le nom de l'enzyme) à une ou plu­sieurs bases de don­nées de réac­tions enzy­ma­tiques. De manière géné­rale, la base de don­née uti­li­sée est Meta­Cyc, mais selon les spé­ci­fi­ci­tés de telle ou telle espèce on pour­ra uti­li­ser des bases de don­nées par­ti­cu­lières. À chaque fois qu'une anno­ta­tion aura été retrou­vée dans Meta­Cyc, Path­way tools ajoute celle-ci au réseau méta­bo­lique en asso­ciant les dif­fé­rents méta­bo­lites entre eux. Ain­si une réac­tion 1 pro­dui­sant un méta­bo­lite B à par­tir d'un sub­strat A pour­ra être cou­plée à une réac­tion 2 pro­dui­sant un méta­bo­lite C à par­tir du B pré­cé­dem­ment iden­ti­fié, et ain­si de suite.

On obtien­dra ain­si un réseau repré­sen­table sous forme de graphe bi-par­tite, un des types de nœuds cor­res­pon­dant aux réac­tions (et indi­rec­te­ment aux gènes et enzymes asso­ciés), l'autre cor­res­pon­dant aux sub­strats et aux pro­duits de ces réac­tions. Les arcs entre ces nœuds per­mettent de faire le lien entre les réac­tions et les com­po­sés bio­chi­miques. Un des apports de Path­way tools est que ce logi­ciel se charge ensuite de décou­per ce réseau en voies méta­bo­liques. Là encore, Path­way tools va aller cher­cher ses connais­sances dans Meta­Cyc, cette base de don­nées asso­ciant chaque réac­tion à un cer­tain nombre de voies méta­bo­liques. Ain­si Path­way tools va regar­der, pour chaque voie méta­bo­lique pré­sente dans la base de don­nées, si un nombre suf­fi­sant de réac­tions appar­te­nant à cette voie sont pré­sentes dans le draft. Si c'est le cas, le logi­ciel va consi­dé­rer cette voie comme étant pré­sente chez notre orga­nisme, qu'elle com­porte des trous, ou non. La « com­plé­tion » de ces trous inter­vien­dra ulté­rieu­re­ment dans le pro­ces­sus de recons­truc­tion.

Après avoir appli­qué cette approche, on se retrouve donc avec réseau méta­bo­lique qui n'est certes pas par­fait mais duquel on peut tout de même reti­rer quelques infor­ma­tions. Par exemple, on va pou­voir voir quelles voies méta­bo­liques sont pré­sentes ou non chez notre espèce d'étude, voir si le draft est proche de ceux que l'on peut obte­nir chez des espèces proches, etc.

 Et ensuite ?

Comme je vous l'ai dit aupa­ra­vant, cette recons­truc­tion n'est en géné­ral que le début du tra­vail. Elle sera sui­vie d'autres approches qui consis­te­ront à com­plé­ter le réseau à la main, en y inté­grant notam­ment toutes les connais­sances qui ne sont pas pré­sentes dans les bases de don­nées car trop spé­ci­fiques à un orga­nisme don­né, ou auto­ma­ti­que­ment en uti­li­sant toute sorte de méthodes qui seront déve­lop­pées sur ce même blog ulté­rieu­re­ment.

 Pour aller plus loin

Cet article n'est bien évi­dem­ment qu'une intro­duc­tion à la recons­truc­tion auto­ma­tique de réseaux méta­bo­liques. Pour une vue plus "glo­bale" du tra­vail de recons­truc­tion on peut se réfé­rer à l'excellent article d'Ines Thiele et Bern­hard Ø Pals­son qui fait le tour à la fois de la recons­truc­tion ini­tiale mais éga­le­ment des méthodes pour une amé­lio­ra­tion ulté­rieure du réseau. On pour­ra notam­ment y décou­vrir que d'autres outils que Path­way tools existent pour effec­tuer le type de recons­truc­tion pré­sen­té dans l'article. On peut par exemple citer les logi­ciels meta­SHARK ou AUTOGRAPH mais cette liste est, vous vous en dou­tez, loin d'être exhaus­tive.



Pour continuer la lecture :


Commentaires

Une réponse à “Reconstruction automatique de réseaux métaboliques”

  1. On peut aus­si citer Model Seed qui per­met de géné­rer auto­ma­ti­que­ment un réseau méta­bo­lique uti­li­sable pour les ana­lyses de flux à par­tir d'un pro­téome :
    http://​www​.nature​.com/​n​b​t​/​j​o​u​r​n​a​l​/​v​2​8​/​n​9​/​f​u​l​l​/​n​b​t​.​1​6​7​2​.​h​tml.

    Pour ceux qui sont inté­res­sés, j'ai mis aus­si des cours en ligne sur cette ques­tion :
    http://​sites​.google​.com/​s​i​t​e​/​l​c​o​t​t​r​e​t​/​t​e​a​c​h​ing

Laisser un commentaire