Représenter le métabolisme — les réseaux métaboliques

*grosse voix très sérieuse*

Atten­tion ! L'article qui suit est le pre­mier d'une série d'articles sur la repré­sen­ta­tion du méta­bo­lisme sous forme de réseaux et leur ana­lyse.


 

Il existe, en bio­in­for­ma­tique, plu­sieurs caté­go­ries de modèles pour décrire le méta­bo­lisme.
Tout d’abord, les modèles pour l’ana­lyse struc­tu­relle du méta­bo­lisme. Cette caté­go­rie regroupe prin­ci­pa­le­ment les modèles repo­sant sur la théo­rie des graphes. Ces der­niers sont basés sur les don­nées qua­li­ta­tives et sont uti­li­sés pour ana­ly­ser des pro­prié­tés topo­lo­giques du réseau ain­si que les dif­fé­rentes inter­ac­tions entre les enti­tés qui y sont repré­sen­tées.

Viennent ensuite les modèles pour l’ana­lyse des flux de matière dans le réseau, notam­ment avec des tech­niques comme la « Flux Balance Ana­ly­sis », dont j'ai déjà par­lé pré­cé­dem­ment dans un article.
Pour finir, il y a les modèles pour l’ana­lyse dyna­mique du méta­bo­lisme. Ces modèles sont orien­tés pour la simu­la­tion du méta­bo­lisme et l’étude de ses pro­prié­tés dyna­miques. Dans ce genre de modèles les graphes peuvent être uti­li­sés, mais étant don­né qu’il s’agit d’étude de la dyna­mique, des infor­ma­tions quan­ti­ta­tives sont requises, fai­sant que les réseaux ne sont que des inter­mé­diaires dans le pro­ces­sus de modé­li­sa­tion. Ce sont des modèles assez com­plexes à construire car néces­sitent des don­nées sur la ciné­tique de cha­cune des trans­for­ma­tions chi­miques dans la cel­lule.

Dans cet article, nous allons donc abor­der l’utilisation des graphes pour la repré­sen­ta­tion du méta­bo­lisme au tra­vers des dif­fé­rents types de graphes qui peuvent être uti­li­sés.


 

Le méta­bo­lisme est l’ensemble des inter­ac­tions molé­cu­laires qui se pro­duisent dans un orga­nisme. Les molé­cules peuvent être divi­sées en deux grands types : les méta­bo­lites (molé­cules sou­vent de petite taille et qui sont les briques cel­lu­laires) et les enzymes qui cata­lysent la trans­for­ma­tion des méta­bo­lites. Il est com­mun de repré­sen­ter le méta­bo­lisme d’un orga­nisme, comme d’autres notions bio­lo­giques où l’interaction entre ses élé­ments est pré­sente, sous forme d’un réseau.

Voi­ci par exemple à quoi peut res­sem­bler un réseau méta­bo­lique :

Exemple d'un réseau métabolique contenant l'ensemble des connaissances disponibles dans les bases de données publiques. Image issue de biochemical-pathways.com
Exemple d'un réseau méta­bo­lique conte­nant l'ensemble des connais­sances dis­po­nibles dans les bases de don­nées publiques. Image issue de bio​che​mi​cal​-path​ways​.com

 

C'est grand et a l'air com­plexe, n'est-ce-pas ? La modé­li­sa­tion des réseaux en graphes mathé­ma­tiques en bio­in­for­ma­tique en faci­lite l’analyse.

Petit apar­té tech­nique (car j'aime bien me la jouer "je peux uti­li­ser des termes com­plexes, mua­ha­ha!"):

Un graphe est une struc­ture uti­li­sée pour modé­li­ser des rela­tions binaires entre les objets d’une col­lec­tion don­née. D’une façon for­melle, un graphe G est défi­ni par un couple (V,E) où V est un ensemble fini de nœuds (ou som­mets) et E est une par­tie de V2 est un ensemble d’arêtes (en cas de graphe non-orien­té) ou d’arcs (en cas de graphe orien­té).

Ain­si, un réseau bio­lo­gique est un ensemble de nœuds et d’arêtes (ou d’arcs si la direc­tion de l’interaction existe et/​ou est connue) éti­que­tés. Ces éti­quettes, ou labels, peuvent être qua­li­ta­tifs, comme, par exemple, des iden­ti­fiants de gènes, de pro­téines, de réac­tions, ou quan­ti­ta­tifs, notam­ment des poids ou des pro­ba­bi­li­tés de tran­si­tion sur les nœuds ou les arêtes. Il existe plu­sieurs types de réseaux méta­bo­liques, où les nœuds et les liens entre les nœuds repré­sentent des enti­tés bio­lo­giques dif­fé­rentes.

Voi­ci un tout petit réseau méta­bo­lique (il s'agit en fait d'une voie méta­bo­lique) qui va nous ser­vir d'exemple de départ ici :

Extrait du métabolisme d'Escherichia coli : fermentation du pyruvate en éthanol. Image provenant de MetaCyc.
Extrait du méta­bo­lisme d'Esche­ri­chia coli : fer­men­ta­tion du pyru­vate en étha­nol. Image pro­ve­nant de Meta­Cyc.

 

Il s'agit d'une façon très humaine de repré­sen­ter le méta­bo­lisme, on y voit les méta­bo­lites, les réac­tions qui trans­forment ces méta­bo­lites, et les enzymes qui cata­lysent ces réac­tions. Logique non ? Sauf que du point de vue infor­ma­tique, c'est pas ter­rible ! Plu­sieurs types d'entités dans une même struc­ture, des arêtes qui fusionnent et qui se scindent… pas très orga­ni­sé tout ça, et sur­tout, pas très facile à ana­ly­ser ! Voi­ci donc plu­sieurs façons de repré­sen­ter ce même réseau méta­bo­lique d'une façon intel­li­gible pour nos machines !

 

1. Réseau de métabolites

Dans le réseau de méta­bo­lites, les nœuds repré­sentent les com­po­sés chi­miques et deux nœuds
sont liés par une arête s'il existe une réac­tion qui per­met la trans­for­ma­tion du pre­mier méta­bo­lite en deuxième (c’est à dire si un des méta­bo­lites est le sub­strat et l’autre le pro­duit).

Réseau de métabolites. Image par l'auteur.
Réseau de méta­bo­lites. Image par l'auteur.

 

2. Réseau de réactions

Dans le réseau de réac­tions, les nœuds repré­sentent les réac­tions bio­chi­miques (cata­ly­sées par des enzymes ou spon­ta­nées). Deux nœuds sont reliés s’il existe un com­po­sé chi­mique pro­duit par la pre­mière réac­tion qui inter­vient comme sub­strat dans la deuxième.

Réseau métabolique de réactions. Image par l'auteur.
Réseau méta­bo­lique de réac­tions. Image par l'auteur.

 

Hé oui, il n'y a que trois réac­tions au final dans le réseau ini­tial !

3. Réseau d’enzymes

Dans le réseau d’enzymes, les nœuds cor­res­pondent aux enzymes. Elles sont reliées par une arête si elles cata­lysent des réac­tions qui ont un com­po­sé chi­mique en com­mun. Ce type de réseau est cepen­dant très peu uti­li­sé car il pré­sente des limites. D’abord, une enzyme peut cata­ly­ser plu­sieurs réac­tions, et par­ti­cu­liè­re­ment des réac­tions qui ont un nombre dif­fé­rent de sub­strats et/​ou de pro­duits. Ce cas intro­duit des courts-cir­cuits dans le réseau. Il existe aus­si des réac­tions qui peuvent être cata­ly­sées par plu­sieurs enzymes (c’est le cas des isoen­zymes et des enzymes peu spé­ci­fiques à grande pro­mis­cui­té de sub­strat comme les alcools déshy­dro­gé­nases). Dans ce cas, la réac­tion sera dupli­quée dans le réseau. Enfin, la connais­sance sur les enzymes n’est pas encore com­plète (de nom­breuses réac­tions enzy­ma­tiques sont orphe­lines d’enzymes) donc le réseau enzy­ma­tique contient for­cé­ment des trous. Cepen­dant, si on ne s’intéresse qu’aux enzymes et aux rela­tions entre elles, la perte d’information struc­tu­relle qu’entraîne l’utilisation de ce type de réseaux n’est pas dom­ma­geable.

Réseau métabolique d'enzymes. Image par l'auteur
Réseau méta­bo­lique d'enzymes. Image par l'auteur

 

Oui, tout petit aus­si !

4. Graphe biparti et hypergraphe des métabolites

Selon ce que l’on sou­haite repré­sen­ter et les infor­ma­tions que l’on veut en tirer, le réseau de méta­bo­lites et le réseau de réac­tions peuvent être impré­cis. Cette impré­ci­sion peut être réso­lue en ajou­tant des éti­quettes sur les arêtes (avec les iden­ti­fiants des réac­tions ou des méta­bo­lites pour lever l’ambiguïté res­pec­ti­ve­ment sur un réseau de méta­bo­lites ou un réseau de réac­tions). Il existe aus­si des modèles de graphes plus élo­quents pour lever cette ambi­guï­té : le graphe bipar­ti et l’hypergraphe de méta­bo­lites.

Un graphe bipar­ti est un graphe dans lequel l’ensemble des nœuds peut être divi­sé en deux ensembles tota­le­ment dis­joints V et U tel que chaque arête du graphe relie un nœud d’un ensemble à un nœud de l’autre ensemble.

Réseau métabolique bipartie. Image par l'auteur.
Réseau méta­bo­lique bipar­tie. Image par l'auteur.

 

Concrè­te­ment, deux nœuds d’un même ensemble ne peuvent être reliés par une arête. Dans la modé­li­sa­tion du méta­bo­lisme, ces deux ensembles de nœuds cor­res­pondent aux méta­bo­lites et aux réac­tions et les arêtes relient les méta­bo­lites et les réac­tions.

Un hyper­graphe de méta­bo­lites est un graphe où les nœuds repré­sentent des méta­bo­lites qui sont reliés entre eux par une hyper­arête s’ils inter­viennent dans une même réac­tion comme sub­strats ou comme pro­duits. Une hyper­arête est une arête qui peut lier deux nœuds et plus (une arête simple relie au plus deux nœuds).

Une hyperarête orientée qui relie le pyruvate à l'acétyl-CoA et au Formate. Image par l'auteur.
Une hyper­arête orien­tée qui relie le pyru­vate à l'acétyl-CoA et au For­mate. Image par l'auteur.

 

Un graphe bipar­ti et un hyper­graphe de méta­bo­lites sont stric­te­ment équi­va­lents en termes de quan­ti­té et qua­li­té d’informations et le pas­sage de l’un à l’autre est très simple.

Il existe, bien évi­dem­ment, d’autres façons de repré­sen­ter le méta­bo­lisme sous la forme d’un réseau, mais elles sont moins fré­quem­ment étu­diées et ne seront donc pas décrites ici.

Achtung !

(oui, depuis que j'ai démé­na­gé en Alle­magne, ça me prend de crier en rouge par­fois 🙂 )

Tous les méta­bo­lites n’ont pas la même fonc­tion et ne sont pas pré­sents en mêmes quan­ti­tés ou au même moment dans la cel­lule. Même si l’étude décrite ici se porte essen­tiel­le­ment sur un modèle sta­tique du méta­bo­lisme, qui repré­sente tous les états pos­sibles connus du méta­bo­lisme, la ques­tion des com­po­sés ubi­qui­taires demeure impor­tante. Il faut donc les prendre en compte lorsque l'on sou­haite faire de la recons­truc­tion de réseaux méta­bo­liques cor­rects ! Com­ment ? Para­graphe sui­vant !

5. Composés ubiquitaires et réseaux « petit-monde »

Dans toutes les façons de repré­sen­ter le méta­bo­lisme, décrites pré­cé­dem­ment, les réac­tions et les méta­bo­lites sont consi­dé­rés comme des acteurs équi­va­lents. Or, comme vous devez le savoir d'après vos cours de bio (si vous en avez sui­vi, bien sûr!), par­mi les méta­bo­lites on trouve les cofac­teurs (par exemple l’ATP et le NAD) qui, bien que par­fois pré­sents dans les équa­tions de réac­tions, ne sont pas leurs com­po­sants prin­ci­paux. Inter­viennent, éga­le­ment, dans les réac­tions, des molé­cules ubi­qui­taires comme par exemple l’eau (H2O), le dioxyde de car­bone (CO2 ) et le dioxy­gène (O2 ). Ces molé­cules sont sou­vent en excès dans le milieu cel­lu­laire et elles se retrouvent impli­quées dans de très nom­breuses réac­tions. Si on tient compte de ces com­po­sés ubi­qui­taires dans la modé­li­sa­tion du méta­bo­lisme, on risque de se retrou­ver avec des réseaux trop connexes (pour un grand nombre de couples (u, v) de som­mets dans ce réseau, il existe un che­min de u à v) et concen­trés autour de ces méta­bo­lites. Ceci peut mener à de mau­vaises inter­pré­ta­tions, car on va notam­ment connec­ter entre eux des réac­tions et des enzymes qui n’ont rien en com­mun à part un cofac­teur.

Une étude sur le méta­bo­lisme de Esche­ri­chia coli, publiée en 2001 montre qu’une modé­li­sa­tion d’un réseau méta­bo­lique com­plet, où tous les méta­bo­lites, mêmes les ubi­qui­taires, sont pré­sents, exhibe des pro­prié­tés de réseaux « petit monde ». Un réseau dit « petit monde » est un modèle mathé­ma­tique uti­li­sé pour repré­sen­ter des réseaux réels. Par exemple, les réseaux sociaux ont la pro­prié­té de petit monde car dans la majo­ri­té des cas, deux nœuds (c’est à dire deux indi­vi­dus), peuvent être reliés par un très faible nombre de connais­sances inter­mé­diaires. Dans le cadre de cette même étude, les auteurs montrent que l’on peut relier n’importe quelle paire de méta­bo­lites de ce réseau par un che­min rela­ti­ve­ment court. Cepen­dant, en se posi­tion­nant du point de vue cel­lu­laire, on ne s’intéresse pas sim­ple­ment à relier des méta­bo­lites entre eux via n’importe quel che­min pos­sible, mais dans un ordre bien pré­cis ayant un sens bio­lo­gique. Comme l’a démon­tré une autre étude parue en 2004, d’un point de vue bio­chi­mique, la meilleure alter­na­tive est de se concen­trer sur les motifs de chan­ge­ments struc­tu­raux des méta­bo­lites d’intérêt et sur les flux d’atomes de car­bone dans les voies méta­bo­liques. L’auteur démontre entre autres que le réseau méta­bo­lique de Esche­ri­chia coli n’est pas un réseau petit monde, et que l’on a tout inté­rêt à reti­rer (ou démar­quer) les com­po­sés ubi­qui­taires pour étu­dier le méta­bo­lisme d’une façon opti­male et cal­cu­ler des che­mins réa­listes entre les com­po­sés.

Plu­sieurs tech­niques per­mettent de trai­ter ces méta­bo­lites gênants. La pre­mière consiste à tout sim­ple­ment reti­rer les méta­bo­lites les plus fré­quents. Il faut tou­te­fois fixer un seuil pour défi­nir à par­tir de quel moment un méta­bo­lite est « trop » fré­quent. On court aus­si le risque d’éliminer des réac­tions essen­tielles dans les­quelles des molé­cules ubi­qui­taires inter­viennent comme com­po­sants prin­ci­paux (la syn­thèse de l’ATP à par­tir de l’ADP par exemple, ou la réac­tion qui per­met d’obtenir du dihy­dro­gène (H2 ) à par­tir de deux pro­tons).

Une autre méthode consiste à reti­rer les méta­bo­lites auxi­liaires des réac­tions. Elle est plus per­ti­nente que la pre­mière car elle a l’avantage de ne pas reti­rer sys­té­ma­ti­que­ment les méta­bo­lites ubi­qui­taires, consi­dé­rant le contexte dans lequel ceux-là sont employés. Ain­si, en repre­nant l’exemple de la syn­thèse de l’ATP à par­tir de l’ADP, où ces méta­bo­lites sont les com­po­sés prin­ci­paux, ils ne seront pas reti­rés. Par contre, dans une réac­tion où l’ATP agit comme un don­neur de phos­phate et d’énergie, il sera enle­vé. La dif­fi­cul­té prin­ci­pale de cette méthode est de défi­nir sys­té­ma­ti­que­ment pour chaque réac­tion les com­po­sés prin­ci­paux et auxi­liaires. Cette sélec­tion peut se faire auto­ma­ti­que­ment en uti­li­sant la notion de voie méta­bo­lique, où un com­po­sé est prin­ci­pal (ou « pri­maire ») s’il est pro­duit et consom­mé dans la voie. Dans la base de don­nées Meta­Cyc, lorsqu’une réac­tion fait par­tie d’une voie méta­bo­lique, les com­po­sés chi­miques sont mar­qués comme « pri­maires » ou « secon­daires » selon s'ils sont un des sub­strats ini­tiaux ou pro­duits finaux, ou décrits comme com­po­sé inter­mé­diaire dans la voie méta­bo­lique. La dis­tinc­tion entre les méta­bo­lites prin­ci­paux et auxi­liaires peut aus­si se faire manuel­le­ment à par­tir de des­sins de cartes méta­bo­liques comme celles de KEGG.


Voi­ci donc la fin de ce pre­mier article sur la repré­sen­ta­tion et l'analyse du méta­bo­lisme ! A très bien­tôt pour de nou­velles aven­tures méta­bo­liques, où on par­le­ra notam­ment des dif­fé­rents types d'analyses que l'on peut effec­tuer sur ces réseaux !

 


Mer­ci à Kum­qua­tum et Lroy pour leurs cor­rec­tions et sug­ges­tions !



Pour continuer la lecture :


Commentaires

Laisser un commentaire