- Le blog participatif de bioinformatique francophone depuis 2012 -

Métagénomique : différences fondamentales avec la génomique

Qu'est ce que la métagénomique ?

 Depuis quelques années, la méta­gé­no­mique semble s'installer de plus en plus par­mi les sciences du vivant. Bien que plu­sieurs tech­niques et modi ope­ran­di se cachent der­rière le terme "méta­gé­no­mique", on peut y appo­ser une défi­ni­tion géné­rale : la méta­gé­no­mique vise à étu­dier l'ensemble des génomes issus d'un même milieu ain­si que les inter­ac­tions entre ces génomes. Par exemple, on peut pré­le­ver un échan­tillon de sol ou d'eau de mer et regar­der d'un seul coup tous les micro-orga­nismes vivant dans ce milieu. Or, comme une très grande pro­por­tion des micro-orga­nismes n'est pas culti­vable en milieu contrô­lé (plus de 99,9% dans l'eau de mer¹), la méta­gé­no­mique va consis­ter à tout séquen­cer direc­te­ment, sans pas­ser par une phase de culture ou de dif­fé­ren­cia­tion des espèces pré-séquen­çage.

Actuel­le­ment, la méta­gé­no­mique s'appuie donc très for­te­ment sur les NGS (Next-Gene­ra­tion Sequen­cing pour Séquen­çage de nou­velle géné­ra­tion) afin de réa­li­ser du séquen­çage à très haut débit. Le coût de pro­duc­tion des don­nées est ain­si de plus en plus faible, ce qui per­met à de plus en plus de bio­lo­gistes de fran­chir le pas vers la méta­gé­no­mique. Mais, si l'utilisation des NGS per­met d'obtenir énor­mé­ment de don­nées à coût modé­ré, ces nou­velles tech­no­lo­gies apportent aus­si leur lot de dif­fi­cul­tés. En effet, depuis peu de temps, la géné­ra­tion des don­nées n'est plus le point limi­tant d'une étude méta­gé­no­mique ; c'est doré­na­vant l'analyse des don­nées qui est longue et coû­teuse ! L'augmentation consi­dé­rable de la quan­ti­té de don­nées pose ain­si de nou­veaux chal­lenges aux logi­ciels exis­tants. Par exemple, cal­cu­ler une simple simi­la­ri­té de séquence peut deve­nir très long pour de gros jeux de don­nées. Tout cela pèse sur la fai­sa­bi­li­té d'une étude méta­gé­no­mique.

Pour conclure sur une défi­ni­tion assez large de la méta­gé­no­mique, il faut pré­ci­ser qu'il est sou­vent très dif­fi­cile, voire impos­sible, d'avoir en sor­tie d'une ana­lyse méta­gé­no­mique la liste pré­cise de tous les génomes (méta­gé­nome) pré­sents dans l'échantillon à l'origine. Par contre, on peut avoir des infor­ma­tions per­ti­nentes sur la com­mu­nau­té micro­bienne qui vit dans le milieu, sur l'activité d'un éco­sys­tème à un moment don­né… Enfin, cela per­met d'étudier le fonc­tion­ne­ment des orga­nismes tels qu'ils sont dans leur envi­ron­ne­ment et non pas tels qu'ils sont après quelque temps pas­sé dans un labo­ra­toire, iso­lés des autres orga­nismes.

Principales différences entre la génomique et la métagénomique

Comme nous venons de le voir, il est presque impos­sible de retrou­ver pré­ci­sé­ment tous les génomes conte­nus dans un méta­gé­nome. Dès lors, on com­prend que les ques­tions aux­quelles on va essayer de répondre en méta­gé­no­mique ne seront pas les même qu'en géno­mique.

En géné­ral, on essaie de répondre à trois ques­tions fon­da­men­tales : Qui est pré­sent dans mon échan­tillon ? Que font-ils ? Qui fait quoi ? Mais, à l'inverse de la géno­mique où on tend à asso­cier un gène ou une par­tie d'un gène à un orga­nisme, en méta­gé­no­mique on asso­cie un gène, une fonc­tion bio­lo­gique ou un pro­ces­sus à un habi­tat. Le para­digme est donc fon­da­men­ta­le­ment dif­fé­rent !

Une autre dif­fé­rence majeure entre la géno­mique et la méta­gé­no­mique réside dans les don­nées. En méta­gé­no­mique, de mul­tiples espèces sont mélan­gées dans les don­nées mais chaque espèce n'est pas repré­sen­tée de la même manière dans l'échantillon. Par exemple, il est tout à fait pos­sible d'avoir deux échan­tillons extrê­me­ment dif­fé­rents conte­nant cha­cun exac­te­ment les mêmes espèces ! En effet, il est impor­tant de dif­fé­ren­cier la pré­sence ou l'absence d'une espèce avec sa repré­sen­ta­tion dans l'habitat. Une espèce peut repré­sen­ter à elle seule 90% d'un échan­tillon mais n'être que très fai­ble­ment pré­sente dans un second échan­tillon. On com­prend dès lors que les deux échan­tillons n'auront pas le même com­por­te­ment bio­lo­gique. Les espèces très fai­ble­ment repré­sen­tées dans un habi­tat sont géné­ra­le­ment dif­fi­ciles à étu­dier dans un unique méta­gé­nome, d'où la néces­si­té actuelle de pou­voir com­pa­rer plu­sieurs méta­gé­nomes. De plus, cette com­pa­rai­son est néces­saire pour com­prendre com­ment les dif­fé­rences géno­miques affectent, et sont affec­tées par, les fac­teurs phy­si­co-chi­miques d'un éco­sys­tème.

Il faut bien gar­der en tête qu'une ana­lyse méta­gé­no­mique d'un milieu com­plexe ne repré­sente sou­vent qu'une par­tie de la com­mu­nau­té micro­bienne à un moment don­né. Rien ne dit qu'en pre­nant un échan­tillon le len­de­main à 10 cm du pre­mier on obtien­dra sen­si­ble­ment les mêmes résul­tats. Si on vou­lait être vrai­ment exhaus­tif, pro­duire un jeu de don­nées repré­sen­ta­tif de la com­mu­nau­té micro­bienne d'un unique gramme de sol néces­si­te­rait plus de 6000 cycles de fonc­tion­ne­ment (run) d'un HiSeq2000 pour un coût total d'environ 267 mil­lions de dol­lars⁴. La méta­gé­no­mique per­met d'avoir un sous-ensemble d'une com­mu­nau­té et néces­site donc des outils spé­ci­fiques, dif­fé­rents de ceux uti­li­sés en géno­mique.

Mal­gré ces dif­fé­rences fon­da­men­tales, de nom­breux pro­jets de méta­gé­no­mique conti­nuent d'utiliser les pro­to­coles stan­dards d'analyses géno­miques : séquen­cer le plus pos­sible (on parle de pro­fon­deur de séquen­çage, chaque mor­ceau d'ADN étant séquen­cé plu­sieurs dizaines de fois), assem­bler les lec­tures (petits mor­ceaux d'ADN qu'on obtient en sor­tie d'un séquen­ceur) en mor­ceaux plus grands puis fina­le­ment anno­ter ces séquences géno­miques. Or, dans tout ce pro­ces­sus, les espèces très fai­ble­ment repré­sen­tées dans l'échantillon ont toutes les chances d'être consi­dé­rées comme des arté­facts et ain­si igno­rées ; ceci peut mener à des biais lors de l'analyse des don­nées.

 Comme la méta­gé­no­mique est à la fois une dis­ci­pline très récente et géné­rant une quan­ti­té de don­nées sans pré­cé­dent dans les sciences du vivant, seuls quelques logi­ciels par­mi les plus connus en géno­mique sont uti­li­sables en pra­tique. Mais comme la méta­gé­no­mique et la géno­mique ne répondent pas aux mêmes ques­tions, un réel besoin de nou­veaux logi­ciels se fait sen­tir. Ces logi­ciels doivent répondre aux ques­tions et aux besoins spé­ci­fiques dic­tés par la méta­gé­no­mique. Mais il peut aus­si être impor­tant de bien iden­ti­fier les ques­tions bio­lo­giques qu'on se pose afin de limi­ter la géné­ra­tion inutile de don­nées, dans un réflexe géno­mique de séquen­cer le plus pos­sible pour obte­nir de meilleurs résul­tats.

Pour aller plus loin :
1. Amann RI, Lud­wig W & Schlei­fer KH (1995) Phy­lo­ge­ne­tic iden­ti­fi­ca­tion and in situ detec­tion of indi­vi­dual micro­bial cells without culti­va­tion. Micro­biol Rev 59 : 143–169.

2. Woo­ley, JC, God­zik, A, Fried­berg, I (2010). A pri­mer on meta­ge­no­mics. PLoS Com­put. Biol., 6, 2:e1000667.

3. Ken­ne­dy, J, Fle­mer, B, Jack­son, SA, Lejon, DP, Mor­ris­sey, JP, O'Gara, F, Dob­son, AD (2010). Marine meta­ge­no­mics : new tools for the stu­dy and exploi­ta­tion of marine micro­bial meta­bo­lism. Mar Drugs, 8, 3:608–28.

4. Desai, N, Anto­no­pou­los, D, Gil­bert, JA, Glass, EM, Meyer, F (2012). From geno­mics to meta­ge­no­mics. Curr. Opin. Bio­tech­nol., 23, 1:72–6.




Commentaires

5 réponses à “Métagénomique : différences fondamentales avec la génomique”

  1. Avatar de akira

    Un article excelent qui par­vient à tout gar­der en fran­çais (j'aurai uti­li­sé read pour lec­ture ^^). J'ai jus­te­ment un pro­jet de méta­gé­no­mique qui com­mence et j'ai déjà ren­con­tré toutes les dif­fi­cul­tées dont tu parles dans le pilot et je dois dire qu'elles me font bien peur pour la suite.

    1. Nico M.
      Nico M.

      Mer­ci 🙂 C'est vrai que read est bien plus uti­li­sé, mais j'ai sou­vent enten­du "lec­ture" en confé­rence, donc j'ai déci­dé de le repla­cer.

      Quand aux dif­fi­cul­tés, il ne faut pas en avoir peur, au contraire ! C'est là qu'on peut, en tant que bioin­fo, avoir des idées inno­vantes et déve­lop­per de nou­veaux outils ou méthodes !

      Bonne conti­nua­tion pour ton pro­jet 😉

  2. Mer­ci pour ton article, que j'ai trou­vé très inté­res­sant et construc­tif !

  3. Avatar de fairouza

    Je te remer­cie infi­ni­ment pour toutes ces infor­ma­tions . Je compte appli­quer cette tech­nique pro­chai­ne­ment et donc tout ce qui se rap­porte à la méta-géno­mique m'est pré­cieux.

  4. Bon­jour,

    Mer­ci beau­coup pour cet expo­sé (très bien expli­qué). Je suis en Licence 2 de bio­in­for­ma­tique et le monde de la méta­gé­no­mique m'interesse beau­coup. Pour­rais tu stp faire aus­si un expo­sé sur 'KRAKEN', voi­ci le site web : https://​ccb​.jhu​.edu/​s​o​f​t​w​a​r​e​/​k​r​a​k​en/
    https://​ccb​.jhu​.edu/​s​o​f​t​w​a​r​e​/​k​r​a​k​e​n​/​M​A​N​U​A​L​.​h​tml

    Mer­ci d'avance et bonne jour­née tout en espé­rant te lire de nou­veau 😀

Laisser un commentaire