Promiscuité enzymatique, ou comment gérer l'annotation des enzymes

N'importe quel bio­in­for­ma­ti­cien, débu­tant ou confir­mé, s'est confron­té au moins une fois dans sa vie à ce pro­blème : l'annotation d'une séquence. Vous me direz, faciiiiiile ! Il y a désor­mais des tonnes d'outils qui per­mettent, très rapi­de­ment en plus, de trou­ver une fonc­tion pour une séquence ! Alors, déjà, il y a BLAST, Inter­Pro, Pfam, PRIAM, HMMER, … et bien d'autres ! Puis il y a tel­le­ment de séquences déjà anno­tées dans des bases de don­nées manuel­le­ment curées comme Swiss­Prot que l'annotation fonc­tion­nelle n'est plus vrai­ment un pro­blème !

Bon, vous vous dou­tez bien que si on écrit un article sur l'annotation fonc­tion­nelle sur ce blog, c'est que tout n'est pas aus­si simple. Aujourd'hui je ne par­le­rai pas des dif­fé­rents outils d'annotation fonc­tion­nelle des pro­téines, bien que ce soit un sujet très inté­res­sant. Je ne ferai que men­tion­ner la très grande pro­por­tion de pro­téines anno­tées comme "uncha­rac­te­ri­zed", "puta­tive" ou "pro­tein of unk­nown func­tion" dans Uni­Prot (pour info, plus de 40% de pro­téines dans cette base de don­nées sont anno­tées avec un de ces trois termes !). Même, j'outrepasserai le fait qu'un nombre dif­fi­ci­le­ment esti­mable de pro­téines sont mal anno­tées : une étude de 2009 com­bi­nant des méthodes bio­in­for­ma­tiques et expé­ri­men­tales a mon­tré que dans les familles de pro­téines étu­diées, l'annotation de 5 à 63% de ses membres était fausse.

Image générée avec memegenerator.net

 

Non, aujourd'hui j'ai pré­vu de par­ler d'un pro­blème auquel on ne pense pas suf­fi­sam­ment sou­vent, sur­tout en tant que bio­in­for­ma­ti­cien — la pro­mis­cui­té enzy­ma­tique, ain­si que des pro­blèmes que ça pose pour l'annotation fonc­tion­nelle, et les pistes à envi­sa­ger pour réduire les dégâts.

Petit aparté introductif pour rappeler quelques définitions

Une enzyme (on peut aus­si dire "un" enzyme, les deux sont cor­rects et vali­dés par l'Académie Fran­çaise) est une pro­téine qui est capable de cata­ly­ser (c'est à dire d'accélérer, voire, de rendre pos­sible dans les condi­tions cel­lu­laires) des réac­tions bio­chi­miques. Ces réac­tions per­mettent de trans­for­mer des méta­bo­lites (petites molé­cules chi­miques) en d'autres méta­bo­lites, plus inté­res­sants pour le bon fonc­tion­ne­ment de la cel­lule. Une acti­vi­té enzy­ma­tique est la réac­tion qu'une enzyme est capable de cata­ly­ser ain­si que la façon méca­nis­tique de le faire.


La promiscuité enzymatique — kézako ?

Les enzymes sont connues pour être des cata­ly­seurs extrê­me­ment spé­ci­fiques. Pour­tant, l’idée que beau­coup d’enzymes sont capables de cata­ly­ser d’autres réac­tions et/​ou de trans­for­mer d’autres sub­strats en plus de ceux pour les­quels elles se sont spé­cia­li­sées au cours de l’évolution n’est pas nou­velle. Ces enzymes, qui ne font pas que ce qu’on attend d’elles, sont appe­lées enzymes pro­mis­cui­taires (des espèces d'enzymes sta­kha­no­vistes, qui ne font pas uni­que­ment la tâche atten­due, ces petites malines !). Une des pre­mières publi­ca­tions sur une enzyme pro­mis­cui­taire date de 1921 et décrit la pyru­vate décar­boxy­lase pour sa capa­ci­té à for­mer des liai­sons car­bone-car­bone entre de nom­breuses molé­cules. Une des grandes hypo­thèses actuelles pro­pose que les acti­vi­tés enzy­ma­tiques pro­mis­cui­taires servent de point de départ pour l’évolution des orga­nismes et de leur méta­bo­lisme.

Sont décrits actuel­le­ment trois types majeurs de pro­mis­cui­té :

  • sub­strat : l'enzyme est capable de cata­ly­ser le même type de trans­for­ma­tion chi­mique sur plu­sieurs sub­strats dif­fé­rents
  • réac­tion : l'enzyme est capable de cata­ly­ser plu­sieurs types de réac­tions sur un ou plu­sieurs sub­strats dif­fé­rents
  • condi­tion : remar­quée chez des pro­téines dont la fonc­tion peut varier consi­dé­ra­ble­ment sui­vant les condi­tions phy­si­co-chi­miques (varia­tion de tem­pé­ra­ture, pH, sali­ni­té, ou présence/​absence de cer­taines molé­cules dans le milieu). Ces enzymes pro­mis­cui­taires de condi­tion sont sou­vent (mais pas tou­jours!) appe­lées "moon­ligh­ting enzymes" (ou enzymes "luna­tiques" chez les fren­chies).

 

Courtesy of Systems Biology Research Group, UC San Diego, Jacobs School of Engineering
Cour­te­sy of Sys­tems Bio­lo­gy Research Group, UC San Die­go, Jacobs School of Engi­nee­ring

 

Pour nous, ça vou­dra dire qu'une enzyme (sous la forme d'une séquence pro­téique) devra être anno­tée avec plus d'une fonc­tion (là, il y a une diver­si­té de pos­si­bi­li­tés, anno­ta­tions tex­tuelles, EC num­bers, termes GO pour ne citer que ceux-là).

Nous avons désor­mais de plus en plus d'indices indi­quant que la grande majo­ri­té, sinon toutes les enzymes sont pro­mis­cui­taires d'une façon ou d'une autre. Et c'est là que les choses se com­pliquent ! Car oui, dans un monde idéal, il fau­drait arri­ver à asso­cier toutes les réac­tions qu'une enzyme est capable de cata­ly­ser à sa séquence, et mettre tout ça dans les bases de don­nées publiques, à dis­po­si­tion de la com­mu­nau­té scien­ti­fique.

Le poten­tiel pro­mis­cui­taire des enzymes entraîne l’évolution de nou­velles fonc­tions enzy­ma­tiques au sein de super­fa­milles struc­tu­rales et par consé­quence, l’émergence de nou­velles familles ou super­fa­milles d’enzymes. Chez les orga­nismes pro­ca­ryotes notam­ment, leur style de vie pousse les enzymes à être pro­mis­cui­taires, cette plas­ti­ci­té cata­ly­tique favo­ri­sant gran­de­ment la sur­vie en cas de chan­ge­ment bru­tal de l’environnement.

Ça sonne super bien tout ça… mais au final, en quoi la pro­mis­cui­té enzy­ma­tique est pro­blé­ma­tique ?

Les enzymes nous trollent

Image générée avec memegenerator.net

Le pro­blème prin­ci­pal de la pro­mis­cui­té enzy­ma­tique est la dif­fi­cul­té, voire, l'impossibilité, de connaître toutes les capa­ci­tés cata­ly­tiques d'une enzyme don­née, dans toutes les condi­tions ima­gi­nables. Vu que nous avons appris dès les bancs du lycée qu'une enzyme est une pro­téine hyper spé­cia­li­sée pour un méta­bo­lite don­né (prin­cipe clé-ser­rure, rap­pe­lez-vous !), une fois qu'une acti­vi­té enzy­ma­tique a été asso­ciée à une séquence pro­téique, on a ten­dance à la lais­ser tran­quille et pas­ser à la sui­vante.

Ceci crée bien sûr des lacunes dans les connais­sances sur le monde vivant, que la com­mu­nau­té scien­ti­fique cherche quo­ti­dien­ne­ment à com­bler. Et ces lacunes entraînent un cer­tain nombre de pro­blèmes plus pra­tiques, en plus du côté noble de la recherche de la com­pré­hen­sion du monde qui nous entoure. Je ne vais pas pré­tendre citer ici tous les pro­blèmes que ceci peut engen­drer, mais je vais essayer de vous don­ner une idée.

Tout d'abord, ne pas connaître tout le poten­tiel des enzymes crée auto­ma­ti­que­ment une incom­plé­tion dans la recons­truc­tion des réseaux méta­bo­liques à par­tir de génomes entiers. Et donc, en plus des pro­blèmes que ça peut entraî­ner du point de vue cal­cu­la­toire, cette incom­plé­tion ne per­met pas d'identifier toutes les capa­ci­tés méta­bo­liques de l'organisme, et donc de l'utiliser à bon escient (ce bon escient pou­vant être l'industrie agro-ali­men­taire, la phar­ma­ceu­tique et la méde­cine, la bio-dépol­lu­tion, et bien d'autres).

Le fait de ne pas connaître tout le poten­tiel des enzymes dans un orga­nisme empêche par­fois d'identifier les "backup enzymes" (pour les anglo­phobes, je ne sais pas tra­duire ce terme dans ce contexte, déso­lée — vos pro­po­si­tions de tra­duc­tion sont les bien­ve­nues 🙂 — et le terme "enzymes de sau­ve­garde" ne repré­sente pas tout à fait la réa­li­té). Une enzyme de backup est une enzyme qui est capable d'assumer le rôle d'une autre (il s'agit sou­vent d'un rôle essen­tiel) dans le cas où une de ses consœurs est mutée ou son gène est ren­du non-fonc­tion­nel. Ceci peut poser des pro­blèmes dans les expé­riences où on sup­prime un ou plu­sieurs gènes pour com­prendre leur fonc­tion­ne­ment et leur impor­tance dans l'organisme, et peut conduire à de fausses conclu­sions quand à la fonc­tion prin­ci­pale de ceux-là.

La pro­mis­cui­té enzy­ma­tique pose aus­si pro­blème dans le domaine de l'annotation fonc­tion­nelle de nou­velles séquences par trans­fert d'annotation (la façon la plus répan­due et la plus rapide d'annoter en fait!) car cela entraîne auto­ma­ti­que­ment la pro­pa­ga­tion de l'incomplétion (et/​ou de la misan­no­ta­tion) au niveau des anno­ta­tions. Donc on se retrouve avec des séquences enzy­ma­tiques de plus en plus nom­breuses et de moins en moins bien anno­tées. Et ça, c'est embê­tant.

Der­nier cas que je vais évo­quer ici, celui des acti­vi­tés enzy­ma­tiques orphe­lines de séquences (appe­lées "enzymes orphe­lines" pour faire plus court). Dans cette pro­blé­ma­tique assez com­plexe en soi, les enzymes pro­mis­cui­taires peuvent aus­si jouer un rôle impor­tant. Les enzymes orphe­lines sont des acti­vi­tés enzy­ma­tiques que l'on connaît, on sait qu'elles sont pré­sentes dans l'organisme, mais on ne sait pas du tout (mais du tout, même avec des trans­ferts d'annotation) quelle enzyme effec­tue cette acti­vi­té (oui, ça existe, et ce phé­no­mène concerne plus de 20% des acti­vi­tés enzy­ma­tiques clas­sées par la nomen­cla­ture de la Com­mis­sion Enzy­ma­tique). Ces acti­vi­tés orphe­lines pour­raient se cacher en fait par­mi les capa­ci­tés incon­nues des enzymes pro­mis­cui­taires.

 

Comment révéler tout le potentiel d'une enzyme ?

Alors com­ment résoudre le pro­blème posé par la pro­mis­cui­té enzy­ma­tique ? Peut-on vrai­ment mettre la main sur tout ce qu'une enzyme est capable de faire ? Voi­ci quelques solu­tions pos­sibles !

La pro­mis­cui­té enzy­ma­tique, ain­si que le poten­tiel "d'évolvabilité" pro­mis­cui­taire des enzymes, peuvent être pré­dits avec des méthodes ché­mo­in­for­ma­tiques et sta­tis­tiques (quelques liens à la fin de cet article) qui com­binent à la fois struc­ture des pro­téines et struc­ture des méta­bo­lites.

On peut aus­si essayer de pré­dire qu'une enzyme est capable de cata­ly­ser la même réac­tion sur des com­po­sés chi­miques de struc­ture simi­laire à son méta­bo­lite préféré/​connu. Dans ce cas, les outils de pré­dic­tion de simi­la­ri­té de struc­ture molé­cu­laire (indice de Tani­mo­to, bien sûr, mais aus­si des méthodes ché­mo­in­for­ma­tiques plus avan­cées) sont d'une très grande uti­li­té.

On peut aus­si envi­sa­ger de faire du "docking" (amar­rage) molé­cu­laire à haut débit. Il s'agit d'une tech­nique de modé­li­sa­tion 3D des enzymes où on essaye de faire "ren­trer" dans la poche cata­ly­tique divers méta­bo­lites. S'il y a une confi­gu­ra­tion pos­sible pour que le méta­bo­lite puisse ren­trer dans la poche, celui-là sera un bon can­di­dat pour être cata­ly­sé par l'enzyme.

On peut aus­si essayer de faire de l'intégration de don­nées issues de mul­tiples bases de don­nées publiques afin de croi­ser les infor­ma­tions et voir s'il y a des diver­gences entre ces dif­fé­rentes sources pour com­plé­ter les infor­ma­tions sur l'enzyme en ques­tion. Mais comme les très grandes bases de don­nées bio­lo­giques com­mu­niquent entre elles (ce qui est très très bien d'ailleurs !), il faut sou­vent aller recher­cher ces infor­ma­tions dans de petites bases de don­nées assez spé­cia­li­sées, et le croi­se­ment de don­nées dans ce cas peut deve­nir com­plexe à cause des éven­tuelles dif­fé­rences d'identification des enzymes ou de la séman­tique uti­li­sée.

Je vou­drais aus­si men­tion­ner l'Enzyme Func­tion Ini­tia­tive (EFI pour les intimes) qui est une grande col­la­bo­ra­tion entre plein de labo pour pro­po­ser des outils qui per­mettent d'améliorer la pré­dic­tion de la fonc­tion des enzymes appar­te­nant à une même famille de pro­téines en fonc­tion de leur voi­si­nage géno­mique et méta­bo­lique.

Cepen­dant, la meilleure solu­tion reste, comme très sou­vent en sciences de la vie, l'expérimentation. À mon avis (qui est un avis per­son­nel, hein!), la meilleure tech­no­lo­gie reste pour l'instant le scree­ning enzy­ma­tique à haut débit. Il s'agit de tes­ter la cata­lyse ou non de beau­coup de méta­bo­lites dif­fé­rents pour chaque enzyme. Les résul­tats sont sou­vent assez sur­pre­nants, car on découvre vrai­ment un tout nou­veau poten­tiel cata­ly­tique pour les enzymes ana­ly­sées, mais il ne faut pas non plus oublier qu'il s'agit d'expériences in vitro sur des enzymes puri­fiées, donc dans des condi­tions pas très natu­relles…

 

Est-ce que un jour on connaî­tra le poten­tiel cata­ly­tique com­plet de toutes les enzymes ? La ques­tion reste ouverte, mais j'espère bien que oui, cela faci­li­te­ra bien la vie aux bio­in­for­ma­ti­ciens qui tra­vaillent sur le méta­bo­lisme et tous les autres ! 😀

 

Un peu de littérature sur le sujet :

Généraliste :

Recent advances in enzyme pro­mis­cui­ty

Moon­ligh­ting pro­teins

Méthodes :

Mole­cu­lar signa­tures-based pre­dic­tion of enzyme pro­mis­cui­ty

Enzyme assays for high-through­put scree­ning


Un grand mer­ci à Aki­ra, Hed­Jour et Nico M. pour leurs cor­rec­tions, dis­cus­sion, patience et la ten­ta­tive de me faire fran­ci­ser les termes scien­ti­fiques !



Pour continuer la lecture :


Commentaires

3 réponses à “Promiscuité enzymatique, ou comment gérer l'annotation des enzymes”

  1. Avatar de Melanie Rossotti
    Melanie Rossotti

    Bon­jour,
    J'ai du mal à com­prendre la dif­fé­rence entre le docking et le scree­ning.. Dans les 2 cas c'est de la modé­li­sa­tion d'interactions entre dif­fé­rents méta­bo­lites et le site actif d'une enzyme non ?

    1. Alors oui, le docking est en effet la modé­li­sa­tion de l'intéraction de deux molé­cules (l'enzyme étant la deuxième molé­cule dans le cas du scree­ning enzy­ma­tique), mais le scree­ning enzy­ma­tique, tel que je l'ai décrit dans cet article est pure­ment expé­ri­men­tal.
      Dans ce "hight-through­put enzyme scree­ning" il s'agit de tes­ter les capa­ci­tés cata­ly­tiques d'une enzyme (basi­que­ment, si on met une enzyme et une molé­cule en grande concen­tra­tion dans un même puits, est-ce qu'il se passe quelque chose — et ce, pour un très grand nombre de sub­strats). Il ne s'agit donc pas de méthode de modé­li­sa­tion ici.
      Dans cer­tains mauels et papiers, on uti­lise le terme de "scree­ning" pour dési­gner le pro­ces­sus de docking enzy­ma­tique sur un très grand nombre de molé­cules can­di­dates. Dans ce cas là, le docking est une sous-uni­té de scree­ning

      1. Avatar de Melanie Rossotti
        Melanie Rossotti

        D'accord, je com­prends mieux, mer­ci beau­coup !

        En reli­sant je m'aperçois que j'ai du mal à com­prendre un autre point.. Celui sur les Backup Enzyme.
        Si j'ai bien com­pris, ces Enzymes vont "rem­pla­cer" des enzymes non fonc­tion­nelles, mais du coup ce sont ces enzymes qui vont empê­cher l'identification de la fonc­tion d'un gène ?
        J'ai du mal à faire le lien entre ça et le fait que ne pas connaître tout le poten­tiel des enzymes empêche par­fois d'identifier ces "backup enzymes" ..

        J'espère que je me suis bien expri­mée et mer­ci pour cet article et vos réponses qui m'ont été d'une grande aide.

Laisser un commentaire