La modélisation moléculaire est un ensemble de méthodes permettant d'expliquer comment fonctionne le vivant. En effet, le vivant est une succession d’interactions entre différentes molécules : protéines, ADN, ARN, membranes, etc. Ces molécules interagissent les unes par rapport aux autres en fonction de plusieurs paramètres : leurs formes, leurs propriétés chimiques et leur environnement. La modélisation moléculaire permet de prédire la structure de certaines molécules ainsi que leurs interactions les unes avec les autres.
Les champs de force
La première nécessité quand on fait de la modélisation moléculaire c'est de trouver le champ de force adapté. Un champ de force, en modélisation, n'est pas un bouclier qui permet de se protéger des attaques ennemies dans l'espace ! C'est un ensemble de règles qui permettent de dire si une conformation d'une molécule est plus stable qu'une autre. Prenons un exemple simple : la molécule d'eau. Celle-ci est composée de deux atomes d'hydrogène et d'un d'oxygène. Or ces atomes ne sont pas orientés n'importe comment, ils sont orientés en V avec un angle bien particulier. On pourrait donc dire que de l'eau est plus stable si les deux hydrogènes forment cet angle.
Or, la molécule n'est pas rigide, elle peut varier autour de cette structure stable. Le champ de force va donc être une fonction mathématique qui va permettre de s'approcher de cette conformation stable. Celle-ci pourra par exemple être : si l'angle est l'angle naturel, la fonction retourne 0, sinon elle retourne une valeur positive proportionnelle à la déviation entre l'angle « observé » et l'angle « optimal ». Ainsi, chercher à obtenir la meilleure conformation revient à chercher le minimum de cette fonction.
On complique un peu les choses et on rajoute une deuxième molécule d'eau. Elle aura elle aussi un angle à optimiser. Mais il faudra aussi prendre en compte la première molécule d'eau, avec qui elle fera des liaisons hydrogène. On pourra ajouter à la fonction précédente, un critère de distance entre l'atome d'oxygène d'une des molécules avec les hydrogènes de l'autre. Et voilà, on a un champ de force qui permet de modéliser de l'eau. On peut ajouter autant de molécules d'eau que l'on veut, on pourra toujours appliquer cette fonction au système.
On peut aussi définir des calculs mathématiques pour créer de nouvelles règles pour tous les atomes de toutes les molécules. Mais imaginons que l'on cherche à modéliser une protéine dans de l'eau. Il faudra calculer toutes les interactions entre la protéine et l'eau, entre l'eau et l'eau et entre les atomes de la protéine et les autres atomes de cette protéine. Cela commence à faire beaucoup de calculs, même pour un ordinateur.
C'est pour ça que des choix sont effectués et que différents champs de force sont créés. Certains champs de force « oublient » volontairement certains atomes, mais en modifiant leurs calculs pour faire « comme si » ces paramètres n'avaient pas été oubliés. On peut par exemple oublier l'eau, ou bien considérer que l'on travaille dans un milieu lipidique. On peut aussi considérer que certains groupes d'atomes sont en réalité un seul et unique gros atome. On parle dans ce cas de modèle « gros grain » par opposition aux modèles « tout atome ».
Parmi les plus célèbres champs de force utilisés en bioinformatique on peut citer GROMOS ou AMBER.
La modélisation d'une (ou plusieurs) molécules
Une fois le champ de force choisi (ou créé) il faut maintenant choisir un algorithme de modélisation. Là encore tout dépend de ce que l'on souhaite modéliser. Par exemple si l'on veut modéliser une protéine, on peut jouer sur les différents angles phi et psi pour créer une variabilité, une fois la variabilité créée, il suffit d'appliquer le champ de force pour calculer quelle molécule est la plus proche de la valeur optimale.
Puis on applique de nouvelles variations sur cette molécule afin d'essayer d'approcher de la conformation la plus stable. Là encore les algorithmes pour créer cette variabilité sont variés : algorithmes génétiques, Monte-Carlo… Chacun de ces algorithmes a ses avantages et ses inconvénients, et il est important de prendre en considération chaque possibilité afin de réaliser au mieux sa modélisation. On peut aussi partir d'une molécule existante et utiliser de nombreux outils mathématiques pour déplacer légèrement une molécule dans son espace conformationnel. C'est fortement utile quand une première modélisation a été réalisée dans un espace discret et que l'on souhaite se rapprocher de l'espace continu qu'est la réalité.
Autre exemple : la dynamique moléculaire. Il s'agit de regarder l'évolution d'une molécule dans le temps. Est-ce qu'elle va s'ouvrir ? Se refermer ? Se tourner ? La dynamique consiste à donner une légère impulsion, comme un coup de pied dans un ballon qui se trouverait dans l'espace, et ensuite en suivant les indications du champ de force, on regarde l'évolution de la molécule, comme si le ballon rebondissait sur des murs, ou était attiré par une planète plus ou moins lointaine. Les calculs peuvent être très longs (plusieurs jours, voir un mois), il faut donc préparer la dynamique avec soin.
Je voudrais, en dernier exemple, vous parler du docking. Le docking (ou arrimage moléculaire pour les puristes francophones) fait aussi partie des méthodes de modélisation mais je le considère comme un cas à part. Il utilise les même principes que les autres méthodes de modélisation mais il a la particularité d'essayer de combiner deux molécules ou plus. Le vivant étant constitué des interactions entre différentes molécules, cette modélisation est l'une des plus importantes. Là encore différentes méthodes et algorithmes existent pour placer les deux molécules l'une en face de l'autre, avec chacune plus ou moins de souplesse et essayer de trouver où et comment l’interaction entre ces deux molécules est possible. Là aussi les calculs à effectuer sont nombreux et il faut parfois des jours avant qu'une simulation se termine.
En conclusion, je voudrais mentionner un concours qui a lieu en ce moment : CASP. C'est un concours international qui permet à différentes équipes à travers le monde de montrer leurs capacités à prédire la structure des protéines. Pour plus d'informations (en anglais) allez sur le site de CASP.
Crédit images : Photo par Alan Wolf (CC By NC); Illustrations : Creative Commons
Laisser un commentaire