"I thought there couldn't be anything as complicated as the universe, until I started reading about the cell.“
(Systems Biologist Eric de Silva ‑astrophysicist by training‑, Imperial College London.)
Avec l'arrivée des technologies de séquençage à haut débit (NGS pour les intimes), de plus en plus de génomes complets sont disponibles dans les banques de données publiques ou non. A partir de ces génomes, on peut faire de la reconstruction automatisée de réseaux métaboliques à l'échelle de l'organisme (ou presque). Une fois qu'on dispose de ces réseaux métaboliques, il existe plusieurs approches de modélisation du métabolisme, afin de comprendre (ou du moins avoir une certaine idée) comment ça peut se passer dans l'organisme vivant. Parmi les plus connues il y a :
- les modèles basés sur l’interaction entre différents composants chimiques présents dans la cellule. Dans ce cas là on utilisera la théorie des graphes pour analyser la topologie du réseau métabolique, c'est à dire la nature des interactions :
- les modèles basés sur les relations stœchiométriques contraintes entre composants chimiques. On utilisera dans ce dernier cas des techniques d'analyse de flux pour faire de l'analyse structurelle du réseau métabolique. Il s'agira alors non seulement d'interpréter la nature des interactions entre composants chimiques mais aussi la quantifier :
- les modèles basés sur le mécanisme réactionnel, dont les paramètres cinétiques sont déterminés expérimentalement par des experts biochimistes :
Je parlerais ici du deuxième point de cette liste, c'est à dire de l'analyse des flux dans les réseaux métaboliques. Le "Flux Balance Analysis" (ou FBA par la suite) est une méthode mathématique de simulation du métabolisme dans les reconstructions de réseaux métaboliques à l'échelle d'un génome.
Les bases de la FBA
Le premier pas pour faire une analyse de flux est de représenter le métabolisme sous forme d'un graphe mathématique, décrit dans une matrice stœchiométrique S de taille m*n. Dans cette matrice, chaque ligne représente un composant chimique impliqué dans le métabolisme (m composants), et chaque colonne une réaction connue dans l'organisme étudié (n réactions). Les valeurs des cases de la matrice sont des coefficients stœchiométriques des métabolites participant dans la réaction correspondante (coefficient négatif si le composant est consommé pendant la réaction, positif si il est crée et zéro si il ne participe pas à la réaction).
Le flux passant au travers de toutes les réactions est représenté par le vecteur v, de longueur n. Les concentrations de tous les métabolites sont représentées par le vecteur x de longueur m. On définit aussi le vecteur c, qui indique le poids de la contribution de chaque réaction à la croissance ou non de la cellule. Cette croissance est représentée par la" biomasse" produite par la cellule, un concept imaginé pour simplifier les analyses mais qui n'a que peu de signification réelle. Le système des équations de masse est donné à l'état d'équilibre (dx/dt=0) de façon suivante :
Sv = 0
Tout v qui satisfait cette équation est appelé l'espace nul (on pourra ainsi faire aussi des analyses dessus - "null space analysis") de S.
Le principe de la FBA est de minimiser ou maximiser la fonction objective Z = cv, qui peut ainsi être n'importe laquelle combinaison linéaire des flux. L'optimisation de ce système est réalisé avec de la programmation linéaire.
Pour faire simple, on fait "courir" un flux dans notre réseau de réactions pondéré selon l'importance (nombre et importance des métabolites produits, etc) que ces dernières ont, et on observe le résultat produit par la cellule, la biomasse. Selon ce qu'on veut étudier, on ajuste les différents paramètres des réactions, et on relance si besoin afin de s'approcher au maximum du phénotype souhaité.
L'étape suivante dans la FBA est la définition de l'objectif biologique, pertinent avec le problème étudié. Dans le cas où l'on souhaite prédire la croissance de l'organisme, l'objectif sera la production massive de la biomasse, c'est à dire le taux avec lequel sont produits les métabolites la composant (on parle ici notamment de production d'acides nucléiques, d'acides aminés et de lipides). Mathématiquement parlant, cet objectif est représenté par la "fonction objective" qui indiquera à quel point chaque réaction participera au phénotype souhaité.
A quoi ça sert ?
Cette méthode est avant tout utilisée dans les études physiologiques, car elle permet d'avoir une assez bonne estimation du comportement de l'organisme dans des conditions données. Ensuite, comme toutes les reconstructions métaboliques à partir de génomes entiers sont incomplètes (car contiennent des 'knowledge gaps' où les réactions sont manquantes), la FBA sert de base pour divers algorithmes pour prédire quelles réactions sont manquantes en comparant in silico les simulations de croissance et les résultats expérimentaux. On s'en sert aussi dans le domaine de la biologie synthétique à l'échelle du génome, afin d'améliorer les constructions des nouveaux organismes et simuler leur comportement afin de l'optimiser (pour la production d'un médicament ou pour la catalyse de certains déchets par exemple).
Outils
De très nombreux outils sont disponibles pour faire de l'analyse de flux. Ici, je n'en mentionne que deux que je connais "personnellement", mais il en existe bien d'autres et je refuse de me prononcer sur le(s)quel(s) est(sont) le(s) meilleur(s).
- MetaNetX où toutes les analyses peuvent se faire en ligne, sans avoir besoin de telecharger le logiciel
- COBRA qui est une ToolBox MATLAB
Il existe aussi des librairies R pour faire de la FBA.
Et comme c'est encore la rentrée, et, selon les statistiques, la semaine la plus morose de l'année, je vous laisse admirer la beauté de la complexité de l'intérieur d'une cellule (avec le son, c'est encore mieux!) :
© 2007 The Presidents and Fellows of Harvard College.
Remerciements et poutoux à mes relecteurs (Akira et Nico M.) et aux admins chéris pour leur patience (Yoann M., nahoy et Zazo0o).
Laisser un commentaire