Comparaison de structures : le RMSD

En 1973, Anfin­sen mon­trait qu'une pro­téine se replie en une struc­ture unique et stable. Même si des excep­tions existent, cette règle s'applique à la plu­part des petites pro­téines glo­bu­laires. La struc­ture des pro­téines est non seule­ment stable mais aus­si plus conser­vée que la séquence au cours de l'évolution. En effet, des pro­téines ayant des séquences très diver­gentes pré­sentent des replie­ments simi­laires. Enfin, la struc­ture d'une pro­téine condi­tionne sou­vent sa fonc­tion. Ain­si, lorsqu'une nou­velle struc­ture de pro­téine est décou­verte, une pre­mière tâche est de la com­pa­rer à celles qui sont déjà connues. Je vous pro­pose donc de décou­vrir des méthodes et mesures per­met­tant de com­pa­rer ces struc­tures afin d'en détec­ter les simi­la­ri­tés, aujourd'hui : le RMSD.

rosetta superposition (CC-BY-SA 3.0)
Roset­ta super­po­si­tion (CC-BY-SA 3.0)

Les bases

RMSD signi­fie Root-Mean-Square Devia­tion, en fran­çais la "dévia­tion de la racine de la moyenne des car­rés" ce qui ne veut pas dire grand chose comme ça. En fait, le RMSD n'est pas une mesure spé­ci­fique de la bio­in­for­ma­tique, elle est aus­si uti­li­sée en météo­ro­lo­gie, en éco­no­mie, en psy­cho­lo­gie, etc. Bref dans tous les domaines où l'on a besoin de com­pa­rer des ensembles de valeurs.

En effet, le RMSD consiste sou­vent à com­pa­rer des valeurs théo­riques avec des valeurs obser­vées pour voir à quel point le modèle théo­rique repré­sente bien la réa­li­té. Pour cela, chaque valeur Xi théo­rique est com­pa­rée à la valeur Yi obser­vée. On va donc sous­traire l'une par l'autre et mettre au car­ré (Xi — Yi)2, cela nous donne une idée de la dis­tance qui les sépare. Ensuite, nous allons addi­tion­ner toutes les dis­tances et en faire la moyenne. Enfin, nous pre­nons la racine car­rée de cette moyenne.

Formule du RMSD
For­mule du RMSD

Le RMSD en bioinformatique

En bio­in­for­ma­tique, le RMSD est uti­li­sé pour com­pa­rer des super­po­si­tions de struc­tures de pro­téines. En effet, une fois deux struc­tures ali­gnées, les scien­ti­fiques ont rapi­de­ment eu besoin de savoir à quel point l'alignement était "bon." Or pour cela, une mesure simple est de cal­cu­ler le RMSD en pre­nant comme valeurs les posi­tions des atomes dans l'espace.

On peut ain­si cal­cu­ler la dis­tance spa­tiale entre deux atomes qui sont sen­sés être super­po­sés. On va pas­ser au car­ré, cal­cu­ler la moyenne des dis­tances, appli­quer la racine car­rée et obte­nir une mesure de la qua­li­té de la super­po­si­tion.

Si le RMSD est uti­li­sé pour éva­luer la qua­li­té d'un ali­gne­ment struc­tu­ral, il peut aus­si être au cœur d'un algo­rithme d'alignement qui va cher­cher à opti­mi­ser le RMSD. Une ques­tion se pose alors : le RMSD est-il un bon éva­lua­teur de la qua­li­té d'un ali­gne­ment struc­tu­ral ?

Les avantages et inconvénients

Le RMSD est l'une des plus anciennes valeurs uti­li­sées pour com­pa­rer des struc­tures de pro­téines. Sa sim­pli­ci­té per­met de bien com­prendre com­ment elle fonc­tionne. Néan­moins, une pre­mière cri­tique est celle de l'interprétation. Un RMSD très faible signi­fie que l'alignement est très bon, un très fort signi­fie que ce n'est pas bon du tout… mais entre les deux, où mettre la limite ? Com­ment faire la dif­fé­rence entre deux struc­tures simi­laires, avec quelques petites zones non-simi­laires, et deux struc­tures par­ta­geant un domaine struc­tu­ral com­mun mais com­plè­te­ment dif­fé­rentes sur le reste ?

Une autre cri­tique impor­tante est que le RMSD est dépen­dant de la lon­gueur des pro­téines. Si on com­pare des struc­tures de tailles simi­laires, tout va bien, sinon, le RMSD subi un biais.

Enfin, de nom­breuses petites dis­si­mi­la­ri­tés peuvent entraî­ner un RMSD fort alors que les pro­téines sont glo­ba­le­ment simi­laires.

Conclusion

Mal­gré ces cri­tiques, le RMSD est tou­jours très uti­li­sé. Néan­moins, d'autres mesures et d'autres méthodes d'alignement de struc­ture ont vu le jour ces der­nières années. Nous en ver­rons d'autres au cours de pro­chains billets.

Mer­ci à Nico M.NiGo­Pol, Ook4mi et Clem_​ pour leur relec­ture atten­tive.

 



Pour continuer la lecture :


Commentaires

3 réponses à “Comparaison de structures : le RMSD”

  1. Avatar de Philippe

    Très bien expli­qué, mer­ci !

  2. mer­ci +++ pour cette défi­ni­tion
    d'autres méthodes d'alignement de struc­ture

Laisser un commentaire