DNase-seq, FAIRE-seq, ChIP-seq, trois outils d'analyse de la régulation de l'expression des gènes

23 mai 2013

par

ADN extrait de Cliococca selaginoides (Josh*m, CC BY-NC-SA) — ADN extrait de *Cliococca selaginoides* (Josh*m, CC BY-NC-SA)

La régulation de la transcription est un processus indispensable aux cellules pour permettre leur différenciation, exprimer leur spécificité, assurer leur développement, leur prolifération ou encore pour leur permettre de s'adapter à un environnement. L'étude de la régulation de la transcription passe par l'identification d'éléments clés gouvernant ces processus biologiques.
Ces éléments de régulations se distinguent en deux groupes : les régions cis-régulatrices (région de l'ADN ayant la particularité de contrôler l'expression de gènes plus ou moins éloignés), et les éléments trans (protéines de liaison à l'ADN reconnaissant la plupart du temps les séquences cis).

L'apparition des technologies de séquençage haut débit a bouleversé notre manière d'étudier le génome et son expression. Le couplage des méthodes de biologie moléculaire et du séquençage a permis l'émergence de nouveaux outils permettant d'analyser finement et à l'échelle d'un génome entier l'expression et la régulation des gènes. Dans cet article nous allons nous intéresser à trois de ces techniques : DNase-seq, FAIRE-seq et ChIP-seq.

DNase-seq

La technique de DNase-seq utilise un principe connu des éléments actifs de l'ADN (promoteurs, éléments cis …) qui est que ces régions sont plus accessibles à l'enzyme DNase I que le reste du génome. DNase-seq consiste à mesurer la distribution des clivages de la DNase I pour identifier les régions décondensées de l'ADN contenant des éléments régulateurs de la transcription.

Comme la figure le montre, l'ADN, une fois extrait des cellules d’intérêt, est mis en présence d'une quantité optimale de DNase I afin qu'elle clive l'ADN aux endroits où celui-ci n'est pas condensé. Les fragments d'ADN obtenus sont ensuite purifiés afin d'éliminer les protéines de liaisons qui peuvent subsister. On a alors à ce stade récupéré toutes les portions d'ADN décondensé du génome. Vient ensuite l'étape du marquage de ces fragments qui va permettre leur amplification par PCR et leur identification, puis le séquençage haut débit. Les séquences obtenues sont enfin alignées sur le génome de référence et leur fréquence est analysée pour identifier les régions régulatrices.

FAIRE-seq

Le FAIRE-seq est en quelque sorte une version alternative du DNase-seq. Cette technique se base également sur le fait qu'une région de l'ADN non condensée correspond à une région régulatrice de la transcription. Le FAIRE, pour Formaldehyde-Assisted Isolation of Regulatory Elements, comme son nom l'indique, utilise le formaldéhyde pour fixer la chromatine et toute autre protéine de liaison in vivo. En effet, le formaldéhyde va lier les protéines à l'ADN par des liaisons covalentes, ce qui va en quelque sorte séquestrer cet ADN lors de la purification. On fragmente ensuite l'ADN par sonication (utilisation des ultrasons pour rompre des molécules), et on le purifie avec une solution de phénol-chloroforme. L'ADN non lié à des protéines se retrouve ainsi dans la phase aqueuse du mélange et peut ainsi être prélevé et préparé pour le séquençage, tandis que l'ADN lié aux protéines reste piégé dans la phase organique. Enfin, comme pour le DNase-seq, l'ADN est extrait, marqué, amplifié et séquencé.

Le protocole du FAIRE-seq est plus simple que celui du DNase-seq tout en ayant des résultats tout aussi précis. On notera tout de même que le FAIRE-seq détecte avec une meilleure sensibilité les éléments régulateurs distants mais manque des promoteurs qui sont eux détectés par le DNase-seq.

ChIP-seq

Contrairement aux deux méthodes précédentes le ChIP-seq, pour Chromatin Immunoprecipitation sequencing, est utilisé pour identifier les sites de fixation d'une seule protéine associée à l'ADN. En ciblant une protéine particulière avec un anticorps spécifique, il devient possible de cibler l'analyse que l'on veut mettre en place. En effet, si l'on veut dresser une carte de la chromatine, il faut choisir un anticorps histone-spécifique. On obtiendra alors l'exact opposé des DNAse-seq et FAIRE-seq, à savoir des reads couvrant l'ADN condensé et non l'inverse. Il est également possible de cibler un facteur de transcription ou tout autre type de protéines de liaison.

Le protocole est assez proche de celui du FAIRE-seq. L'ADN est fixé aux protéines avec du formaldéhyde in vivo, puis est fragmenté par sonification. Ensuite des billes couplées à un anticorps spécifiques capturent les protéines d’intérêt et l'ADN qui y est fixé. Cet ADN est ensuite extrait, purifié, marqué, amplifié et séquencé.

Pour aller plus loin

Acquérir de telles données est une chose, mais utiliser ces données et en tirer quelque chose en est une autre. Alors, que faire une fois que nous avons identifier des régions candidates à la régulation de la transcription ? Une des piste est de chercher dans ces régions des motifs connus d'éléments cis, autrement dit, des séquences reconnues par des facteurs de transcription. Pour cela, il existe des bases de données comme par exemple ChIPBase, qui propose tout un arsenal de données relatives aux ChIP-seq évidemment, mais aussi aux sites de reconnaissances de facteurs de transcription pour six organismes. Une fois qu'on a identifié nos régions et nos facteurs, il nous faut découvrir quels gènes ils régulent, puis enfin reconstruire le réseau de régulation. Bref, il y a de quoi s'amuser pour un bon moment 🙂

Références :

Song, L., & Crawford, G. E. (2010). DNase-seq : a high-resolution technique for mapping active gene regulatory elements across the genome from mammalian cells. Cold Spring Harbor protocols, 2010(2), pdb.prot5384. doi:10.1101/pdb.prot5384 [lien]
Zeng, W., & Mortazavi, A. (2012). Technical considerations for functional sequencing assays. Nature immunology, 13(9), 802–7. doi:10.1038/ni.2407 [lien]
Giresi, P. G., Kim, J., McDaniell, R. M., Iyer, V. R., & Lieb, J. D. (2007). FAIRE (Formaldehyde-Assisted Isolation of Regulatory Elements) isolates active regulatory elements from human chromatin. Genome research, 17(6), 877–85. doi:10.1101/gr.5533506 [lien]
Park, P. J. (2009). ChIP-seq : advantages and challenges of a maturing technology. Nature reviews. Genetics, 10(10), 669–80. doi:10.1038/nrg2641 [lien1] [lien 2]
http://en.wikipedia.org/wiki/ChIP-sequencing
http://en.wikipedia.org/wiki/FAIRE-Seq

Merci à Nisaea, Yoann M. et nallias pour leur relecture.

Crédit image : Isabelle Stévant, licence Art Libre.

Partagez cet article

Isabelle S. (ZaZo0o)

Mi-bio, mi-bioinfo, et re-mi-bio derrière. J'ai suivi une licence de biologie cellulaire et génétique et un master de bioinformatique à l'université de Rennes, puis j'ai travaillé comme ingé d'étude en développement web pendant 1 an et demi. Ensuite, j'ai effectué un doctorat en bioinformatique à l'université de Genève (single-cell RNA-seq, paillasse et analyse), puis un premier postdoc mi-bio mi-bioinfo en épigénomique développementale de la Drosophile à l'IGFL à Lyon. Je suis actuellement en postdoc bioinfo à distance pour l'université de Bar Ilan (Tel Aviv), en collaboration avec l'IGH à Montpellier. J'analyse des données multi-omics pour reconstituer la régulation des gènes lors de la différentiation des gonades chez la souris.

Pour continuer la lecture :

Commentaires

5 réponses à “DNase-seq, FAIRE-seq, ChIP-seq, trois outils d'analyse de la régulation de l'expression des gènes”

Anthony

25 mai 2013

Article intéressant, merci. Cependant, il faut tout de même faire attention. Une région ouverte (libre de nucléosome capturée par DNase-Seq ou FAIRE-seq par exemple) ne veut pas forcément dire région régulatrice ! De même, une région où un facteur de transcription se lie n'est pas forcément fonctionnelle. Ce sont de bons indicateurs mais ce n'est pas absolu.

Répondre
1. ZaZo0o
  
  25 mai 2013
  
  En effet, ça reste des indicateurs. J'ai aussi bien conscience qu'une fixation d'un facteur de transcription n'est pas forcement fonctionnelle. Un recoupement avec des données d'expression comme le RNA-seq permettra ensuite de mettre en évidence les régions et fixations "réellement" régulatrices.
  
  Je ne suis pas une experte dans ce domaine, je débute à peine ma thèse et je vais être amenée à mettre en place ces expériences d'ici peu.
  
  Si vous avez des précisions à apporter n'hésitez pas, je n'ai fait que survoler le sujet ^^
  
  Répondre
Magali Michaut

2 juin 2013

Très intéressant, merci. Pour moi qui ne travaille pas sur ces questions, ce rapide résumé comparatif est très utile. 🙂

Répondre
Besson

3 juillet 2013

Très bon article, complet et didactique. Attention toutefois à ne pas oublier que, comme toutes les méthodes globales, ces analyses demandent des validations avec des techniques complémentaires ; en l'occurrence ici, du ChIP traditionnel. Cette notion est particulièrement importante car optimiser des validations dans des conditions différentes de l'analyse globale est parfois extrêmement difficile. Parfois même, la validation donne le contraire de l'analyse globale…

Répondre
Karim

4 janvier 2016

Bonsoir, les informations sont concises et intéressantes.
Bien à vous.

Répondre

Laisser un commentaireAnnuler la réponse.

Pour insérer du code dans vos commentaires, utilisez les balises <code> et <\code>.