Un tour d'horizon des bases de données consacrées au métabolisme

La toute pre­mière acti­vi­té enzy­ma­tique a été décou­verte par Anselme Payen, un chi­miste indus­triel fran­çais qui a piqué, grâce à son génie, la domi­na­tion du mar­ché de borax aux néer­lan­dais. C'était une α‑amylase, iso­lée à par­tir d'un extrait de malt, et capable de décou­per l'amidon en glu­cose. Nom­mée ini­tia­le­ment dias­tase (syno­nyme d'"enzyme" à l'heure actuelle), c'était la pre­mière d'une longue série d'enzymes décou­vertes depuis et par­ta­geant le même suf­fixe : "ase".

Depuis cette époque, les connais­sances sur les enzymes n'ont ces­sé de croître, à tel point qu'à la fin des années 1950, plu­sieurs équipes de bio­chi­mistes se sont mises à vou­loir les clas­si­fier. De ces efforts, et après beau­coup de dis­cus­sions de niveau inter­na­tio­nal, est née la fameuse clas­si­fi­ca­tion des acti­vi­tés enzy­ma­tiques, la clas­si­fi­ca­tion EC (Enzyme Com­mis­sion) par l'IUBMB (Inter­na­tio­nal Union of Bio­che­mis­try and Mole­cu­lar Bio­lo­gy). Là, quelques pré­ci­sions : une acti­vi­té enzy­ma­tique est réa­li­sée par une enzyme (jusque là tout le monde est d'accord, j'espère), du coup il ne faut pas confondre les deux.

Un EC num­ber est un iden­ti­fiant numé­rique com­po­sé de quatre chiffres (digits). Le pre­mier chiffre est pour la classe de la réac­tion (il y a au total 6 classes de réac­tions), le deuxième est pour le type de com­po­sant impli­qué dans la réac­tion, le troi­sième est pour la nature de la réac­tion et le der­nier est sim­ple­ment un numé­ro de série iden­ti­fiant chaque acti­vi­té enzy­ma­tique.

Description des quatre digits d'un EC number.  Image par l'auteur.
Des­crip­tion des quatre digits d'un EC num­ber.
Image par l'auteur.

Les EC num­bers dési­gnent une acti­vi­té (cata­ly­tique de réac­tions bio­chi­miques) qui peut être réa­li­sée par une ou plu­sieurs enzymes (qui sont des pro­téines, donc des objets phy­siques), en une ou plu­sieurs étapes. Une enzyme (on peut d'ailleurs aus­si dire UN enzyme, les deux sont offi­ciel­le­ment valides selon l'Académie Fran­çaise 🙂 ) peut donc être décrite par plu­sieurs EC num­bers (cas des enzymes mul­ti­fonc­tion­nelles) et un EC num­ber peut cor­res­pondre à plu­sieurs enzymes non-homo­logues, mais cata­ly­sant les mêmes réac­tions. Depuis ce temps là, la clas­si­fi­ca­tion EC est la seule et unique façon de clas­si­fier les acti­vi­tés enzy­ma­tiques. Même si il y a des acti­vi­tés enzy­ma­tiques qui ont été très bien décrites, mais ne peuvent être clas­sées selon celle-ci. Et même si sou­mettre une nou­velle acti­vi­té enzy­ma­tique pour qu'elle y soit clas­sée est extrê­me­ment long.

bob l'éponge
Même Bob l’Éponge sait que tout est lié dans le méta­bo­lisme

Bah, me direz-vous, j'ai cli­qué sur le titre de l'article pour voir les dif­fé­rentes res­sources sur le méta­bo­lisme, et l'auteur vient me racon­ter la vie des bio­chi­mistes et des enzymes !

 

Oui, mais c'est for­cé­ment lié. Parce que qu'est-ce qu'est le méta­bo­lisme ? Défi­ni­tion scien­ti­fique (qui peut être dif­fé­rente de celles des dié­té­ti­ciens, spor­tifs, etc) : c'est l'ensemble des réac­tions bio­chi­miques effec­tuées dans un orga­nisme. Donc, l'ensemble des réac­tions qui trans­forment les méta­bo­lites et qui sont très sou­vent cata­ly­sées par des enzymes. On s'y retrouve.

Mais avant de me lan­cer (enfin!) dans la revue des bases de don­nées publiques sur le méta­bo­lisme, je vou­drais pré­ci­ser un autre détail : la notion de voie méta­bo­lique. Il n'y a pas de consen­sus sur la défi­ni­tion d'une voie méta­bo­lique, mal­gré le fait que cer­taines voies sont étu­diées et très bien connues depuis très long­temps. Et ce, parce que le décou­page du méta­bo­lisme en voies méta­bo­liques est com­plè­te­ment arti­fi­ciel et arbi­traire. La plu­part des scien­ti­fiques s'accordent à dire que les voies méta­bo­liques sont des par­ties non-par­ti­tion­nantes du méta­bo­lisme, car une réac­tion peut appar­te­nir à plu­sieurs voies, et qu'il peut y avoir plu­sieurs sous-voies dans une voie abou­tis­sant à la même chose à la fin. Donc, les voies méta­bo­liques sont sou­vent dif­fé­rentes d'une res­source à une autre.

 

Voi­là, je peux (fina­le­ment!) pas­ser à mon sur­vol des res­sources sur le méta­bo­lisme la conscience tran­quille !

 

EC Numbers

On peut retrou­ver toute la clas­si­fi­ca­tion EC offi­cielle à dif­fé­rents endroits main­te­nus par dif­fé­rentes ins­ti­tu­tions. Mais fina­le­ment, elles regroupent toutes les mêmes infor­ma­tions, à quelques jours de déca­lage au moment des mises à jour de la clas­si­fi­ca­tion.

  • ENZYME DB (ExPa­Sy) créée par une col­la­bo­ra­tion entre le SIB (Swiss Ins­ti­tute of Bio­in­for­ma­tics) et l'EBI (Euro­pean Ins­ti­tute of bio­in­for­ma­tics) et main­te­nue par le SIB. Contient aus­si des EC num­bers pré­li­mi­naires défi­nis par les experts de Swiss­Prot lors de l'annotation manuelle des enzymes. On peut les repé­rer à la pré­sence d'un 'n' au niveau du 4é digit.
  • Intenz est la jumelle d'ExPaSy, main­te­nue par l'EBI. Contient aus­si les EC num­bers pré­li­mi­naires.
  • IUBMB(Gerry Moss Pages). Sous ses airs fla­shy et archaïques, cette res­source est THE res­source offi­cielle pour les EC num­bers.
  • Explo­rEnz déve­lop­pée et main­te­nue à Dublin, a l'avantage de sim­pli­ci­té. Elle a aus­si la par­ti­cu­la­ri­té de for­ma­ter les noms des com­po­sants chi­miques selon les stan­dards IUPAC (Inter­na­tio­nal Union of Pure and Applied Che­mis­try) : InCHI.

Au moment de l'écriture de cet article, il y a 5025 EC num­bers valides.

KEGGkegg

The Kyoto Ency­clo­pe­dia of Genes and Genomes est une grande res­source de don­nées rela­tives aux génomes, aux voies méta­bo­liques et aux com­po­sés chi­miques impli­qués dans la vie. KEGG com­porte une quin­zaine de bases de don­nées plus ou moins entre­mê­lées entre elles, mais celles qui nous inté­ressent ici sont PATHWAY, REACTION et ENZYME, qui comme leur nom le sug­gère, contiennent des infor­ma­tions sur les voies méta­bo­liques, les réac­tions et les enzymes les cata­ly­sant, ain­si que sur les trans­for­ma­tions chi­miques liées aux réac­tions. Les voies méta­bo­liques dans KEGG sont décrites d'une façon assez par­ti­cu­lière : elles contiennent l'information sur com­ment se déroule une trans­for­ma­tion d'un com­po­sé chi­mique en un autre dans tous les orga­nismes à la fois, et la voie qui en res­sort est donc assez abs­traite. Un point inté­res­sant à men­tion­ner est que les réac­tions enzy­ma­tiques y sont décrites par des for­mules les décom­po­sant en lots de paires de réac­tifs (RPairs), dont l'alignement des struc­tures chi­miques est réa­li­sé afin d'extraire un pat­tern de conver­sion repré­sen­tant un échange d'atomes entre deux com­po­sés chi­miques. Les réac­tions de KEGG sont décrites sans tenir compte de la charge des com­po­sés chi­miques, à un état de totale pro­to­na­tion.

KEGG en chiffres :

  • nombre de voies méta­bo­liques : 392
  • nombre de réac­tions : 9229
  • nombre de EC num­bers : 5911 (com­prend aus­si des EC num­bers obso­lètes)
  • nombre de gènes : 8660858
  • nombre de com­po­sants chi­miques : 27937
  • nombre d'organismes : 2440

 

MetaCycmetacyc

Meta­Cyc (pro­non­cer avec un accent anglais, "met-a-sike") est une base de don­nées conte­nant des voies méta­bo­liques non-redon­dantes et expé­ri­men­ta­le­ment démon­trées, main­te­nue et déve­lop­pée par l'équipe de Peter Karp au SRI Inter­na­tio­nal. Y sont sto­ckées des don­nées de pré­fé­rence qua­li­ta­tives plu­tôt que quan­ti­ta­tives même s'il com­mence à y avoir quelques don­nées sur la ciné­tique enzy­ma­tique. Ce qui rend cette base de don­nées unique est qu'elle est curée par des experts qui se basent sur la lit­té­ra­ture scien­ti­fique expé­ri­men­tale, conte­nant ain­si des don­nées de très grande qua­li­té. Ici, les voies méta­bo­liques sont plus courtes que dans KEGG, car défi­nies uni­que­ment pour le (ou les) orga­nismes où elles ont été obser­vées. De plus, depuis peu, Meta­Cyc offre désor­mais la pos­si­bi­li­té de voir l'"Atom Map­ping", qui per­met de suivre plus faci­le­ment la trans­for­ma­tion des élé­ments chi­miques lors des réac­tions, via un code cou­leur ou une numé­ro­ta­tion d'atomes. Pour finir, je ne peux pas par­ler de Meta­Cyc sans men­tion­ner le superbe outil déve­lop­pé par la même équipe et qui y est étroi­te­ment lié, Path­way Tools, un outil de pro­duc­tion de réseaux méta­bo­liques à par­tir d'un génome anno­té, dont l'utilisation dans le contexte est décrite dans un article de ce blog. Les réac­tions de Meta­Cyc sont équi­li­brées au niveau des charges et des masses et ont une pro­to­na­tion au pH 7.3.

Meta­Cyc en chiffres :

  • nombre de voies méta­bo­liques : 1928
  • nombre de réac­tions : 10481
  • nombre d'enzymes : 8426
  • nombre de gènes : 8317
  • nombre de com­po­sants chi­miques : 10157
  • nombre de d'organismes : 2362

Meta­Cyc pos­sède beau­coup de petites soeurs, des bases de don­nées très spé­ci­fiées, dédiées à des orga­nismes par­ti­cu­liers. Ces bases de don­nées font par­tie de la col­lec­tion de bases de don­nées Bio­Cyc. La plus connue d'entre-elles est sans doute Eco­Cyc, sur Esche­ri­chia coli K12 .

 

BRENDABrenda

BRENDA est la prin­ci­pale base de don­nées conte­nant des infor­ma­tions bio­chi­miques rela­tives aux acti­vi­tés enzy­ma­tiques, qui  y sont clas­si­fiées uni­que­ment par EC num­bers (ce qui, au vu du nombre réel de réac­tions connues par rap­port au nombre exis­tant d'EC num­bers est dom­mage, car du coup, envi­ron 50% des acti­vi­tés enzy­ma­tiques n'y sont pas décrites…). C'est une res­source d'informations très riche en ce qui concerne les pro­prié­tés bio­chi­miques des enzymes, et contient aus­si des don­nées introu­vables ailleurs, comme la liste la plus com­plète d'organismes dans les­quels les acti­vi­tés enzy­ma­tiques ont été expé­ri­men­ta­le­ment obser­vées. Les experts de BRENDA essayent de com­pen­ser les limi­ta­tions de la clas­si­fi­ca­tion EC en attri­buant aux acti­vi­tés enzy­ma­tiques bien décrites, mais sans EC num­ber, un EC num­ber pro­vi­soire, conte­nant un 'B' au niveau du qua­trième digit. De mon point de vue, stric­te­ment per­son­nel, cette base de don­nées est assez mal orga­ni­sée, on s'y retrouve assez faci­le­ment manuel­le­ment, mais elle est dif­fi­ci­le­ment exploi­table si on veut auto­ma­ti­ser des choses des­sus.

BRENDA en chiffres :

  • nombre d'activités enzy­ma­tiques : 5859
  • nombre d'organismes : 17788
  • nombre de pro­téines : 2811325

 

RHEA rhea

Base de don­nées de réac­tions créée, à l'image d'ExPaSy et d'IntEnz par une col­la­bo­ra­tion entre le SIB et l'EBI. C'est une res­source curée manuel­le­ment, conte­nant des réac­tions décrites en uti­li­sant les espèces chi­miques de ChE­BI. Les réac­tions de RHEA sont équi­li­brées au niveau des charges et des masses et ont une pro­to­na­tion au pH 7.3, comme dans Meta­Cyc. Elles sont aus­si très bien cross-réfé­ren­cées avec d'autres grandes res­sources méta­bo­liques, dont celles décrites plus haut et vers les res­sources biblio­gra­phiques.

RHEA en chiffres :

  • nombre de réac­tions : 21431
  • nombre de com­po­sés chi­miques : 4526

 

Autres bases de don­nées inté­res­santes, plus spé­cia­li­sées, qui n'ont pas été pré­sen­tées :

  • Ami­GO : mole­cu­lar func­tions  une clas­si­fi­ca­tion des acti­vi­tés enzy­ma­tiques selon Gene Onto­lo­gy. Très euca­ryote.
  • SFLD : très bien curée, mais ne contient pas assez d’éléments pour figu­rer dans la liste prin­ci­pale
  • Wiki­Pa­th­ways : une pla­te­forme publique d'annotation de voies méta­bo­liques, que j'étais par­ti­cu­liè­re­ment contente de décou­vrir (mer­ci Guillaume Col­let 🙂 ). Très peu de voies méta­bo­liques bac­té­riennes y sont pré­sentes.
  • CAZy : réfé­rence les enzymes agis­sant sur les car­bo­hy­drates
  • MEROPS : base de don­nées sur les pep­ti­dases
  • REBASE : base de don­nées d'enzymes de res­tric­tion
  • ESTHER : base de don­nées dédiée à l'étude d'estherases et d'alpha/beta hydro­lases
  • Per­oxi­Base : base de don­nées sur les per­oxy­dases
  • Kin­Base : base de don­nées sur les kinases

Un grand mer­ci à Estel et Guillaume Col­let pour la relec­ture, et aux admins pour leur patience et gen­tillesse !



Pour continuer la lecture :


Commentaires

2 réponses à “Un tour d'horizon des bases de données consacrées au métabolisme”

  1. Inté­res­sant, mer­ci. Les lec­teurs seront peut-être inté­res­sés par cet article récent sur la mise à jour du réseau méta­bo­lique humain obte­nu par pré­dic­tions.

    http://​www​.nature​.com/​n​b​t​/​j​o​u​r​n​a​l​/​v​a​o​p​/​n​c​u​r​r​e​n​t​/​f​u​l​l​/​n​b​t​.​2​4​8​8​.​h​tml

  2. Il y a quelques semaines déjà est !enfin ! paru un article com­pa­rant d'une façon très exhaus­tive KEGG et Meta­Cyc : http://www.biomedcentral.com/1471–2105/14/112/abstract

    La cri­tique qui peut être faite est que cette étude a été menée par le même labo qui main­tient Meta­Cyc, mais per­son­nel­le­ment je trouve qu'ils sont très impar­tiaux.

Laisser un commentaire