Découverte :
Le séquençage, une histoire de générations

L'ADN (Acide DésoxyriboNucléique) est une molécule présente dans toutes les cellules des êtres vivants. Elle renferme l'information nécessaire pour se développer et se reproduire. L'information en elle-même est codée par la suite de quatre différents acides nucléiques ordonnés d'une façon compréhensible pour l'organisme.

Décrypter cette information est un enjeu majeur pour la recherche scientifique. Il aide à mieux comprendre et appréhender le fonctionnement des êtres vivants, comprendre certaines maladies et par conséquent les soigner. C'est aussi son décodage qui a permis l'essor de la phylogénie moderne.

Séquence d'ADN (Insuline)

Le séquençage est  le processus utilisé pour la découverte de cette séquence. Plusieurs méthodes existent, se développent et s'améliorent toujours plus avec le temps. Nous en sommes aujourd'hui à la 3ème génération de ces outils de séquençage.

Cet article a pour but de vous présenter un bref aperçu de ces trois générations d'outils et de vous guider vers des articles scientifiques plus complets si vous désirez en savoir plus.

Première génération

Développée par Sanger  en 1975-77 ([1] et [2]) une étape d'amplification génère des fragments d'ADN de différentes longueurs. Chaque fragment se termine par un fluorochrome spécifique, signature d'une des bases. Les fragments sont ensuite traités par électrophorèse. Ceux-ci se regroupent et s'ordonnent en fonction de leur longueur. La séquence des couleurs ainsi lue est alors utilisée pour transcrire le fragment dans son ensemble.

Méthode de Sanger

Il faut noter qu'une autre méthode, chimique, a été proposée par Maxam et Gilbert en 1977 et n'a pas été retenue, plus complexe et difficile à mettre en place, ne résistant pas au passage à l'industrie ([3]).

Pour de plus amples informations sur la première génération d'outil de séquençage, vous pouvez vous diriger vers cet article ou/et celui-ci.

Seconde génération

La seconde génération d'outils de séquençage est apparue en 2005 en réponse au prix élevé et au faible débit du séquençage de première génération. Ici, des dizaines de milliers de séquences sont traitées ensemble, en parallèle. C'est l'apparition du séquençage haut-débit. Le "high throughput sequencing" ou encore le "next-generation sequencing" sont les termes les plus utilisés pour en parler. Il existe de nombreuses techniques, développées par différentes entités dont les principales sont Roche, Illumina et  Life Technologies mais toutes ont la même philosophie, c'est à dire :

  • Amplification de l'ADN  principalement via PCR par émulsion (emPCR) ou par PCR par phase solide (solid- phase amplification).
  • Succession de cycles de lavage et identification ("wash & scan" ) : incorporation de nucléotides dans la chambre de réaction, lavage de la chambre de réaction, capture de l'image.

Méthode du séquençage haut-débit

 

Pour plus d'informations sur le "next generation sequencing" , je vous invite à lire cette revue assez complète, détaillant les technologies utilisées, et comparant les différentes plates-formes de séquençage existantes.

Entre les deux : Ion torrent et Helicos Genetic Analysis System

Ion Torrent ( de Life technologies) est une méthode qui se situe entre la 2eme et 3eme génération d'outil de séquençage. Bien que celle-ci procède de la même façon au niveau de l'amplification de l'ADN et des cycles de "wash-&-scan" , Ion Torrent  supprime le besoin de lumière et de caméras pour étudier la séquence. A la place Ion torrent mesure le largage d'un hydrogène lors de l'incorporation d'une base dans le brin d'ADN. Le décryptage est alors facilité, cela réduit nettement la durée du séquençage et améliore son efficacité.

Helicos Genetic Analysis System (de Helicos BioScience) se rapproche de la troisième génération par le fait qu'il n'y a qu'une seule molécule à séquencer. Pourtant, un coût élevé et des cycles d'arrêt toujours nécessaires ne permettent pas à ce système de faire partie de la troisième génération.


 Troisième génération

La troisième génération de séquençage de masse est symbolisée par le séquençage d'une seule molécule d'ADN (SMS ou "Single Molecule Sequencing" en anglais).

Contrairement à la seconde génération,  aucune amplification de l'ADN (ou ARN) n'est nécessaire pour effectuer les mesures. Une seule molécule est "lue".

Plusieurs technologies et méthodes sont ici à l’œuvre, avec chacune des avantages et des inconvénients. Elle peuvent grossièrement être classées en trois catégories :

  • Séquençage par synthèse, observation de l'ADN polymérase à mesure qu'elle synthétise le brin d'ADN.
  • Détection des bases les unes après les autres au fur et à mesure que la séquence d'ADN passe à travers un nanopore.
  • Observation directe de la molécule d'ADN en utilisant des techniques de microscopie.

3eme generation d'outils de séquençage. (A) Pacific Biosciences - Observation directe de la synthèse de l'ADN en temps réel - (B) Reveo - Inspection directe de la molécule d'ADN par microscopie électronique - (C) Oxford Nanopore - Mesure la translocation des nucleotides par mesure de concentrations ioniques (D) IBM - lecture des bases grâce à leurs signatures électroniques spécifiques.

Je vous redirige sur cet article si vous voulez en savoir plus.

Comparaison

Ce tableau présente les principales différences entre les trois générations d'outils de séquençage haut-débit et présente les améliorations que promet la 3ème génération d'outils de séquençage.

 

 

Nous observons donc que la 3ème génération tente de réunir les avantages des deux premières générations, à savoir des séquences lues plus longues, un temps de séquençage assez court, une résolution et précision élevées et un volume de données important. Elle réussit assez bien, cependant le taux d'erreur du séquençage reste assez élevé (>5%) et la technologie utilisée pose encore beaucoup de problèmes au niveau des insertions/délétions. La troisième génération n'est donc pas encore prête à détrôner complètement le "next-generation sequencing" .
Il faut aussi retenir que certaines techniques permettent d'obtenir la cinétique d'incorporation des bases, ce qui permettra de comprendre des systèmes encore plus complexes comme les patterns (patrons) de méthylation de l'ADN par exemple, faisant avancer la recherche scientifique.

Références :
A rapid method for determining sequences in DNA by primed synthesis with DNA polymerase. F. Sanger et al.(lien)

DNA sequencing with chain-terminating inhibitors F. Sanger et al.(lien)

 A new method for sequencing DNA. A M Maxam et al. (lien)

 Emerging technologies in DNA sequencing. Michael L. Metzker (lien)

DNA sequencing: bench to bedside and beyond. Clyde A. Hutchison (lien)

Transforming single DNA molecules into fluorescent magnetic particles for detection and enumeration of genetic variations. Devin Dressman et al.(lien)

Solid phase DNA amplification: characterisation of primer attachment and amplification mechanisms. Céline Adessi et al. (lien)

Sequencing technologies — the next generation. Michael L. Metzker (lien)

A window into third-generation sequencing. Eric E. Schadt et al (lien)

Images :

Toutes les images, exceptée la première (libre de droit) proviennent de cet article en Open Access.

 

Merci à Clémentine , Benjamin , Aurélien  et Yoann pour les commentaires et discussions lors de l’édition de cet article.

 

  • À propos de
  • Issu de la formation bioinformatique de Bordeaux 2, je suis co-fondateur de ce blog.

    Je travaille actuellement au LCSB au Luxembourg depuis maintenant 1 an et je me prétend un codeur fou.

    A bientôt sur bioinfo-fr !

10 commentaires sur “Le séquençage, une histoire de générations

  1. Superbe article Yo, merci 🙂
    Je me permet de metter un lien vers un autre article intéressant provenant de notre cher ami Philippe:
    http://www.biopsci.com/2012/02/22/sequencage-de-ladn-la-revolution-est-de-nouveau-en-marche/
    Et sans oublier la quatrième génération ou troisième et demie...
    http://www.ademcan.net/index.php?2012/02/22/19/00/33-sequence-your-own-genome-using-a-usb-stick

  2. Super article, moi qui voulait en savoir plus, je suis satisfaite 🙂 !
    Merci beaucoup, je vois mieux comment ça fonctionne et vers où fouiner pour en apprendre davantage.

  3. N\'y a-t-il pas une erreur dans le tableau sur la ligne \"taille de la séquence lue\". Je pense qu\'en seconde génération on lit plusieurs dizaines de kb...
    Merci pour cet article intéressant.

    • Merci pour ton commentaire et ton oeil de Lynx 🙂 La taille des reads en seconde génération est beaucoup moins importante que la première génération Sanger ( tableau original), mais il est vrai que j\'ai été un peu pessimiste. La taille des reads serait plutôt aux alentours de 50-200 bp ( HiSeq).

      • Voire le double avec les reads issues de Roche 454 (~400 bp).

  4. Je reviens sur ce très bon article dans le cadre du vote, juste une petite remarque cependant, il y a plusieurs liens, dans les références, qui sont décalés ou manquants !
    Sinon je suis d\'accord pour dire que 10-50pb est un poil pessimiste... 🙂

    • Merci 😀
      Peux tu me préciser quels sont les liens qui ne vont pas au niveau des références, pour moi ils sont tous ok. Comme cela je le corrige de suite.

      • Le lien 4 mène à l\'article 5, le lien 5 à l\'article 6, le lien 6 à l\'article 7, et le 7 au 8.
        Les liens 1, 2, 3 et 8, 9 sont OK.

        • C\'est corrigé, désolé pour le désagrément.

  5. Très bon article, très bien expliqué sans trop rentrer dans les détails techniques qui nuisent à la compréhension, et très bien référencé pour ceux qui veulent approfondir! Merci beaucoup!

Laisser un commentaire