Le séquençage, une histoire de générations

L'ADN (Acide Désoxy­ri­bo­Nu­cléique) est une molé­cule pré­sente dans toutes les cel­lules des êtres vivants. Elle ren­ferme l'information néces­saire pour se déve­lop­per et se repro­duire. L'information en elle-même est codée par la suite de quatre dif­fé­rents acides nucléiques ordon­nés d'une façon com­pré­hen­sible pour l'organisme.

Décryp­ter cette infor­ma­tion est un enjeu majeur pour la recherche scien­ti­fique. Il aide à mieux com­prendre et appré­hen­der le fonc­tion­ne­ment des êtres vivants, com­prendre cer­taines mala­dies et par consé­quent les soi­gner. C'est aus­si son déco­dage qui a per­mis l'essor de la phy­lo­gé­nie moderne.

Séquence d'ADN (Insu­line)

Le séquen­çage est  le pro­ces­sus uti­li­sé pour la décou­verte de cette séquence. Plu­sieurs méthodes existent, se déve­loppent et s'améliorent tou­jours plus avec le temps. Nous en sommes aujourd'hui à la 3ème géné­ra­tion de ces outils de séquen­çage.

Cet article a pour but de vous pré­sen­ter un bref aper­çu de ces trois géné­ra­tions d'outils et de vous gui­der vers des articles scien­ti­fiques plus com­plets si vous dési­rez en savoir plus.

Première génération

Déve­lop­pée par San­ger  en 1975–77 ([1] et [2]) une étape d'amplification génère des frag­ments d'ADN de dif­fé­rentes lon­gueurs. Chaque frag­ment se ter­mine par un fluo­ro­chrome spé­ci­fique, signa­ture d'une des bases. Les frag­ments sont ensuite trai­tés par élec­tro­pho­rèse. Ceux-ci se regroupent et s'ordonnent en fonc­tion de leur lon­gueur. La séquence des cou­leurs ain­si lue est alors uti­li­sée pour trans­crire le frag­ment dans son ensemble.

Méthode de San­ger

Il faut noter qu'une autre méthode, chi­mique, a été pro­po­sée par Maxam et Gil­bert en 1977 et n'a pas été rete­nue, plus com­plexe et dif­fi­cile à mettre en place, ne résis­tant pas au pas­sage à l'industrie ([3]).

Pour de plus amples infor­ma­tions sur la pre­mière géné­ra­tion d'outil de séquen­çage, vous pou­vez vous diri­ger vers cet article ou/​et celui-ci.

Seconde génération

La seconde géné­ra­tion d'outils de séquen­çage est appa­rue en 2005 en réponse au prix éle­vé et au faible débit du séquen­çage de pre­mière géné­ra­tion. Ici, des dizaines de mil­liers de séquences sont trai­tées ensemble, en paral­lèle. C'est l'apparition du séquen­çage haut-débit. Le "high through­put sequen­cing" ou encore le "next-gene­ra­tion sequen­cing" sont les termes les plus uti­li­sés pour en par­ler. Il existe de nom­breuses tech­niques, déve­lop­pées par dif­fé­rentes enti­tés dont les prin­ci­pales sont Roche, Illu­mi­na et  Life Tech­no­lo­gies mais toutes ont la même phi­lo­so­phie, c'est à dire :

  • Ampli­fi­ca­tion de l'ADN  prin­ci­pa­le­ment via PCR par émul­sion (emP­CR) ou par PCR par phase solide (solid- phase ampli­fi­ca­tion).
  • Suc­ces­sion de cycles de lavage et iden­ti­fi­ca­tion ("wash & scan" ) : incor­po­ra­tion de nucléo­tides dans la chambre de réac­tion, lavage de la chambre de réac­tion, cap­ture de l'image.
Méthode du séquen­çage haut-débit

 

Pour plus d'informations sur le "next gene­ra­tion sequen­cing" , je vous invite à lire cette revue assez com­plète, détaillant les tech­no­lo­gies uti­li­sées, et com­pa­rant les dif­fé­rentes plates-formes de séquen­çage exis­tantes.

Entre les deux : Ion torrent et Helicos Genetic Analysis System

Ion Tor­rent ( de Life tech­no­lo­gies) est une méthode qui se situe entre la 2eme et 3eme géné­ra­tion d'outil de séquen­çage. Bien que celle-ci pro­cède de la même façon au niveau de l'amplification de l'ADN et des cycles de "wash-&-scan" , Ion Tor­rent  sup­prime le besoin de lumière et de camé­ras pour étu­dier la séquence. A la place Ion tor­rent mesure le lar­gage d'un hydro­gène lors de l'incorporation d'une base dans le brin d'ADN. Le décryp­tage est alors faci­li­té, cela réduit net­te­ment la durée du séquen­çage et amé­liore son effi­ca­ci­té.

Heli­cos Gene­tic Ana­ly­sis Sys­tem (de Heli­cos BioS­cience) se rap­proche de la troi­sième géné­ra­tion par le fait qu'il n'y a qu'une seule molé­cule à séquen­cer. Pour­tant, un coût éle­vé et des cycles d'arrêt tou­jours néces­saires ne per­mettent pas à ce sys­tème de faire par­tie de la troi­sième géné­ra­tion.


 Troisième génération

La troi­sième géné­ra­tion de séquen­çage de masse est sym­bo­li­sée par le séquen­çage d'une seule molé­cule d'ADN (SMS ou "Single Mole­cule Sequen­cing" en anglais).

Contrai­re­ment à la seconde géné­ra­tion,  aucune ampli­fi­ca­tion de l'ADN (ou ARN) n'est néces­saire pour effec­tuer les mesures. Une seule molé­cule est "lue".

Plu­sieurs tech­no­lo­gies et méthodes sont ici à l’œuvre, avec cha­cune des avan­tages et des incon­vé­nients. Elle peuvent gros­siè­re­ment être clas­sées en trois caté­go­ries :

  • Séquen­çage par syn­thèse, obser­va­tion de l'ADN poly­mé­rase à mesure qu'elle syn­thé­tise le brin d'ADN.
  • Détec­tion des bases les unes après les autres au fur et à mesure que la séquence d'ADN passe à tra­vers un nano­pore.
  • Obser­va­tion directe de la molé­cule d'ADN en uti­li­sant des tech­niques de micro­sco­pie.
3eme gene­ra­tion d'outils de séquen­çage. (A) Paci­fic Bios­ciences — Obser­va­tion directe de la syn­thèse de l'ADN en temps réel — (B) Reveo — Ins­pec­tion directe de la molé­cule d'ADN par micro­sco­pie élec­tro­nique — (C) Oxford Nano­pore — Mesure la trans­lo­ca­tion des nucleo­tides par mesure de concen­tra­tions ioniques (D) IBM — lec­ture des bases grâce à leurs signa­tures élec­tro­niques spé­ci­fiques.

Je vous redi­rige sur cet article si vous vou­lez en savoir plus.

Comparaison

Ce tableau pré­sente les prin­ci­pales dif­fé­rences entre les trois géné­ra­tions d'outils de séquen­çage haut-débit et pré­sente les amé­lio­ra­tions que pro­met la 3ème géné­ra­tion d'outils de séquen­çage.

 

 

Nous obser­vons donc que la 3ème géné­ra­tion tente de réunir les avan­tages des deux pre­mières géné­ra­tions, à savoir des séquences lues plus longues, un temps de séquen­çage assez court, une réso­lu­tion et pré­ci­sion éle­vées et un volume de don­nées impor­tant. Elle réus­sit assez bien, cepen­dant le taux d'erreur du séquen­çage reste assez éle­vé (>5%) et la tech­no­lo­gie uti­li­sée pose encore beau­coup de pro­blèmes au niveau des insertions/​délétions. La troi­sième géné­ra­tion n'est donc pas encore prête à détrô­ner com­plè­te­ment le "next-gene­ra­tion sequen­cing" .
Il faut aus­si rete­nir que cer­taines tech­niques per­mettent d'obtenir la ciné­tique d'incorporation des bases, ce qui per­met­tra de com­prendre des sys­tèmes encore plus com­plexes comme les pat­terns (patrons) de méthy­la­tion de l'ADN par exemple, fai­sant avan­cer la recherche scien­ti­fique.

Références :
A rapid method for deter­mi­ning sequences in DNA by pri­med syn­the­sis with DNA poly­me­rase. F. San­ger et al.(lien)

DNA sequen­cing with chain-ter­mi­na­ting inhi­bi­tors F. San­ger et al.(lien)

 A new method for sequen­cing DNA. A M Maxam et al. (lien)

 Emer­ging tech­no­lo­gies in DNA sequen­cing. Michael L. Metz­ker (lien)

DNA sequen­cing : bench to bed­side and beyond. Clyde A. Hut­chi­son (lien)

Trans­for­ming single DNA mole­cules into fluo­res­cent magne­tic par­ticles for detec­tion and enu­me­ra­tion of gene­tic varia­tions. Devin Dress­man et al.(lien)

Solid phase DNA ampli­fi­ca­tion : cha­rac­te­ri­sa­tion of pri­mer attach­ment and ampli­fi­ca­tion mecha­nisms. Céline Ades­si et al. (lien)

Sequen­cing tech­no­lo­gies — the next gene­ra­tion. Michael L. Metz­ker (lien)

A win­dow into third-gene­ra­tion sequen­cing. Eric E. Schadt et al (lien)

Images :

Toutes les images, excep­tée la pre­mière (libre de droit) pro­viennent de cet article en Open Access.

 

Mer­ci à Clé­men­tine , Ben­ja­min , Auré­lien  et Yoann pour les com­men­taires et dis­cus­sions lors de l’édition de cet article.

 



Pour continuer la lecture :


Commentaires

10 réponses à “Le séquençage, une histoire de générations”

  1. Avatar de Nolwenn
    Nolwenn

    Super article, moi qui vou­lait en savoir plus, je suis satis­faite 🙂 !
    Mer­ci beau­coup, je vois mieux com­ment ça fonc­tionne et vers où foui­ner pour en apprendre davan­tage.

  2. N'y a‑t-il pas une erreur dans le tableau sur la ligne "taille de la séquence lue". Je pense qu'en seconde géné­ra­tion on lit plu­sieurs dizaines de kb…
    Mer­ci pour cet article inté­res­sant.

    1. Mer­ci pour ton com­men­taire et ton oeil de Lynx 🙂 La taille des reads en seconde géné­ra­tion est beau­coup moins impor­tante que la pre­mière géné­ra­tion San­ger ( tableau ori­gi­nal), mais il est vrai que j'ai été un peu pes­si­miste. La taille des reads serait plu­tôt aux alen­tours de 50–200 bp ( HiSeq).

      1. Voire le double avec les reads issues de Roche 454 (~400 bp).

  3. Avatar de Claire Rioualen
    Claire Rioualen

    Je reviens sur ce très bon article dans le cadre du vote, juste une petite remarque cepen­dant, il y a plu­sieurs liens, dans les réfé­rences, qui sont déca­lés ou man­quants !
    Sinon je suis d'accord pour dire que 10–50pb est un poil pes­si­miste… 🙂

    1. Mer­ci 😀
      Peux tu me pré­ci­ser quels sont les liens qui ne vont pas au niveau des réfé­rences, pour moi ils sont tous ok. Comme cela je le cor­rige de suite.

      1. Avatar de Claire Rioualen
        Claire Rioualen

        Le lien 4 mène à l'article 5, le lien 5 à l'article 6, le lien 6 à l'article 7, et le 7 au 8.
        Les liens 1, 2, 3 et 8, 9 sont OK.

        1. C'est cor­ri­gé, déso­lé pour le désa­gré­ment.

  4. Très bon article, très bien expli­qué sans trop ren­trer dans les détails tech­niques qui nuisent à la com­pré­hen­sion, et très bien réfé­ren­cé pour ceux qui veulent appro­fon­dir ! Mer­ci beau­coup !

Laisser un commentaire