Découverte :
DNase-seq, FAIRE-seq, ChIP-seq, trois outils d'analyse de la régulation de l'expression des gènes

ADN extrait de Cliococca selaginoides (Josh*m, CC BY-NC-SA)

ADN extrait de Cliococca selaginoides (Josh*m, CC BY-NC-SA)

La régulation de la transcription est un processus indispensable aux cellules pour permettre leur différenciation, exprimer leur spécificité, assurer leur développement, leur prolifération ou encore pour leur permettre de s'adapter à un environnement. L'étude de la régulation de la transcription passe par l'identification d'éléments clés gouvernant ces processus biologiques.
Ces éléments de régulations se distinguent en deux groupes : les régions cis-régulatrices (région de l'ADN ayant la particularité de contrôler l'expression de gènes plus ou moins éloignés), et les éléments trans (protéines de liaison à l'ADN reconnaissant la plupart du temps les séquences cis).

L'apparition des technologies de séquençage haut débit a bouleversé notre manière d'étudier le génome et son expression. Le couplage des méthodes de biologie moléculaire et du séquençage a permis l'émergence de nouveaux outils permettant d'analyser finement et à l'échelle d'un génome entier l'expression et la régulation des gènes. Dans cet article nous allons nous intéresser à trois de ces techniques : DNase-seq, FAIRE-seq et ChIP-seq.

DNase-seq

Principe de la DNase-seq (adaptation de  Zeng & Mortazavi, 2012)

Principe de la DNase-seq (adaptation de Zeng
& Mortazavi, 2012)

La technique de DNase-seq utilise un principe connu des éléments actifs de l'ADN (promoteurs, éléments cis ...) qui est que ces régions sont plus accessibles à l'enzyme DNase I que le reste du génome. DNase-seq consiste à mesurer la distribution des clivages de la DNase I pour identifier les régions décondensées de l'ADN contenant des éléments régulateurs de la transcription.

Comme la figure le montre, l'ADN, une fois extrait des cellules d’intérêt, est mis en présence d'une quantité optimale de DNase I afin qu'elle clive l'ADN aux endroits où celui-ci n'est pas condensé. Les fragments d'ADN obtenus sont ensuite purifiés afin d'éliminer les protéines de liaisons qui peuvent subsister. On a alors à ce stade récupéré toutes les portions d'ADN décondensé du génome. Vient ensuite l'étape du marquage de ces fragments qui va permettre leur amplification par PCR et leur identification, puis le séquençage haut débit. Les séquences obtenues sont enfin alignées sur le génome de référence et leur fréquence est analysée pour identifier les régions régulatrices.

FAIRE-seq

Principe du FAIRE-seq (adaptation de Giresi & al., 2007)

Principe du FAIRE-seq (adaptation de Giresi & al., 2007)

Le FAIRE-seq est en quelque sorte une version alternative du DNase-seq. Cette technique se base également sur le fait qu'une région de l'ADN non condensée correspond à une région régulatrice de la transcription. Le FAIRE, pour Formaldehyde-Assisted Isolation of Regulatory Elements, comme son nom l'indique, utilise le formaldéhyde pour fixer la chromatine et toute autre protéine de liaison in vivo. En effet, le formaldéhyde va lier les protéines à l'ADN par des liaisons covalentes, ce qui va en quelque sorte séquestrer cet ADN lors de la purification. On fragmente ensuite l'ADN par sonication (utilisation des ultrasons pour rompre des molécules), et on le purifie avec une solution de phénol-chloroforme. L'ADN non lié à des protéines se retrouve ainsi dans la phase aqueuse du mélange et peut ainsi être prélevé et préparé pour le séquençage, tandis que l'ADN lié aux protéines reste piégé dans la phase organique. Enfin, comme pour le DNase-seq, l'ADN est extrait, marqué, amplifié et séquencé.

Le protocole du FAIRE-seq est plus simple que celui du DNase-seq tout en ayant des résultats tout aussi précis. On notera tout de même que le FAIRE-seq détecte avec une meilleure sensibilité les éléments régulateurs distants mais manque des promoteurs qui sont eux détectés par le DNase-seq.

ChIP-seq

ChIP-seq

Principe du ChIP-seq

Contrairement aux deux méthodes précédentes le ChIP-seq, pour Chromatin Immunoprecipitation sequencing, est utilisé pour  identifier les sites de fixation d'une seule protéine associée à l'ADN. En ciblant une protéine particulière avec un anticorps spécifique, il devient possible de cibler l'analyse que l'on veut mettre en place. En effet, si l'on veut dresser une carte de la chromatine, il faut choisir un anticorps histone-spécifique. On obtiendra alors l'exact opposé des DNAse-seq et FAIRE-seq, à savoir des reads couvrant l'ADN condensé et non l'inverse. Il est également possible de cibler un facteur de transcription ou tout autre type de protéines de liaison.

Le protocole est assez proche de celui du FAIRE-seq. L'ADN est fixé aux protéines avec du formaldéhyde in vivo, puis est fragmenté par sonification. Ensuite des billes couplées à un anticorps spécifiques capturent les protéines d’intérêt et l'ADN qui y est fixé. Cet ADN est ensuite extrait, purifié, marqué, amplifié et séquencé.

Pour aller plus loin

Acquérir de telles données est une chose, mais utiliser ces données et en tirer quelque chose en est une autre. Alors, que faire une fois que nous avons identifier des régions candidates à la régulation de la transcription ? Une des piste est de chercher dans ces régions des motifs connus d'éléments cis, autrement dit, des séquences reconnues par des facteurs de transcription. Pour cela, il existe des bases de données comme par exemple ChIPBase, qui propose tout un arsenal de données relatives aux ChIP-seq évidemment, mais aussi aux sites de reconnaissances de facteurs de transcription pour six organismes. Une fois qu'on a identifié nos régions et nos facteurs, il nous faut découvrir quels gènes ils régulent, puis enfin reconstruire le réseau de régulation. Bref, il y a de quoi s'amuser pour un bon moment 🙂

Références:

  • Song, L., & Crawford, G. E. (2010). DNase-seq: a high-resolution technique for mapping active gene regulatory elements across the genome from mammalian cells. Cold Spring Harbor protocols, 2010(2), pdb.prot5384. doi:10.1101/pdb.prot5384 [lien]
  • Zeng, W., & Mortazavi, A. (2012). Technical considerations for functional sequencing assays. Nature immunology, 13(9), 802–7. doi:10.1038/ni.2407 [lien]
  • Giresi, P. G., Kim, J., McDaniell, R. M., Iyer, V. R., & Lieb, J. D. (2007). FAIRE (Formaldehyde-Assisted Isolation of Regulatory Elements) isolates active regulatory elements from human chromatin. Genome research, 17(6), 877–85. doi:10.1101/gr.5533506 [lien]
  • Park, P. J. (2009). ChIP-seq: advantages and challenges of a maturing technology. Nature reviews. Genetics, 10(10), 669–80. doi:10.1038/nrg2641 [lien1] [lien 2]
  • http://en.wikipedia.org/wiki/ChIP-sequencing
  • http://en.wikipedia.org/wiki/FAIRE-Seq

Merci à  Nisaea, Yoann M. et nallias pour leur relecture.

Crédit image: Isabelle Stévant, licence Art Libre.

  • À propos de
  • Passionnée d'informatique, de logiciels libres, de graphisme, touche à tout, curieuse et têtue comme une bretonne.

    Diplomée d'une licence de biologie cellulaire et moléculaire et du master de bioinformatique de Rennes; précédemment stagiaire longue durée à l'EMBL-EBI à Cambridge UK puis ingénieur d'étude au laboratoire d'informatique médicale de Rennes et actuellement doctorante en biologie/bioinformatique à l'université de Genève.

5 commentaires sur “DNase-seq, FAIRE-seq, ChIP-seq, trois outils d'analyse de la régulation de l'expression des gènes

  1. Article intéressant, merci. Cependant, il faut tout de même faire attention. Une région ouverte (libre de nucléosome capturée par DNase-Seq ou FAIRE-seq par exemple) ne veut pas forcément dire région régulatrice! De même, une région où un facteur de transcription se lie n\'est pas forcément fonctionnelle. Ce sont de bons indicateurs mais ce n\'est pas absolu.

    • En effet, ça reste des indicateurs. J\'ai aussi bien conscience qu\'une fixation d\'un facteur de transcription n\'est pas forcement fonctionnelle. Un recoupement avec des données d\'expression comme le RNA-seq permettra ensuite de mettre en évidence les régions et fixations \"réellement\" régulatrices.

      Je ne suis pas une experte dans ce domaine, je débute à peine ma thèse et je vais être amenée à mettre en place ces expériences d\'ici peu.

      Si vous avez des précisions à apporter n\'hésitez pas, je n\'ai fait que survoler le sujet ^^

  2. Très intéressant, merci. Pour moi qui ne travaille pas sur ces questions, ce rapide résumé comparatif est très utile. 🙂

  3. Très bon article, complet et didactique. Attention toutefois à ne pas oublier que, comme toutes les méthodes globales, ces analyses demandent des validations avec des techniques complémentaires ; en l\'occurrence ici, du ChIP traditionnel. Cette notion est particulièrement importante car optimiser des validations dans des conditions différentes de l\'analyse globale est parfois extrêmement difficile. Parfois même, la validation donne le contraire de l\'analyse globale...

  4. Bonsoir, les informations sont concises et intéressantes.
    Bien à vous.

Laisser un commentaire