La régulation de la transcription est un processus indispensable aux cellules pour permettre leur différenciation, exprimer leur spécificité, assurer leur développement, leur prolifération ou encore pour leur permettre de s'adapter à un environnement. L'étude de la régulation de la transcription passe par l'identification d'éléments clés gouvernant ces processus biologiques.
Ces éléments de régulations se distinguent en deux groupes : les régions cis-régulatrices (région de l'ADN ayant la particularité de contrôler l'expression de gènes plus ou moins éloignés), et les éléments trans (protéines de liaison à l'ADN reconnaissant la plupart du temps les séquences cis).
L'apparition des technologies de séquençage haut débit a bouleversé notre manière d'étudier le génome et son expression. Le couplage des méthodes de biologie moléculaire et du séquençage a permis l'émergence de nouveaux outils permettant d'analyser finement et à l'échelle d'un génome entier l'expression et la régulation des gènes. Dans cet article nous allons nous intéresser à trois de ces techniques : DNase-seq, FAIRE-seq et ChIP-seq.
DNase-seq
La technique de DNase-seq utilise un principe connu des éléments actifs de l'ADN (promoteurs, éléments cis …) qui est que ces régions sont plus accessibles à l'enzyme DNase I que le reste du génome. DNase-seq consiste à mesurer la distribution des clivages de la DNase I pour identifier les régions décondensées de l'ADN contenant des éléments régulateurs de la transcription.
Comme la figure le montre, l'ADN, une fois extrait des cellules d’intérêt, est mis en présence d'une quantité optimale de DNase I afin qu'elle clive l'ADN aux endroits où celui-ci n'est pas condensé. Les fragments d'ADN obtenus sont ensuite purifiés afin d'éliminer les protéines de liaisons qui peuvent subsister. On a alors à ce stade récupéré toutes les portions d'ADN décondensé du génome. Vient ensuite l'étape du marquage de ces fragments qui va permettre leur amplification par PCR et leur identification, puis le séquençage haut débit. Les séquences obtenues sont enfin alignées sur le génome de référence et leur fréquence est analysée pour identifier les régions régulatrices.
FAIRE-seq
Le FAIRE-seq est en quelque sorte une version alternative du DNase-seq. Cette technique se base également sur le fait qu'une région de l'ADN non condensée correspond à une région régulatrice de la transcription. Le FAIRE, pour Formaldehyde-Assisted Isolation of Regulatory Elements, comme son nom l'indique, utilise le formaldéhyde pour fixer la chromatine et toute autre protéine de liaison in vivo. En effet, le formaldéhyde va lier les protéines à l'ADN par des liaisons covalentes, ce qui va en quelque sorte séquestrer cet ADN lors de la purification. On fragmente ensuite l'ADN par sonication (utilisation des ultrasons pour rompre des molécules), et on le purifie avec une solution de phénol-chloroforme. L'ADN non lié à des protéines se retrouve ainsi dans la phase aqueuse du mélange et peut ainsi être prélevé et préparé pour le séquençage, tandis que l'ADN lié aux protéines reste piégé dans la phase organique. Enfin, comme pour le DNase-seq, l'ADN est extrait, marqué, amplifié et séquencé.
Le protocole du FAIRE-seq est plus simple que celui du DNase-seq tout en ayant des résultats tout aussi précis. On notera tout de même que le FAIRE-seq détecte avec une meilleure sensibilité les éléments régulateurs distants mais manque des promoteurs qui sont eux détectés par le DNase-seq.
ChIP-seq
Contrairement aux deux méthodes précédentes le ChIP-seq, pour Chromatin Immunoprecipitation sequencing, est utilisé pour identifier les sites de fixation d'une seule protéine associée à l'ADN. En ciblant une protéine particulière avec un anticorps spécifique, il devient possible de cibler l'analyse que l'on veut mettre en place. En effet, si l'on veut dresser une carte de la chromatine, il faut choisir un anticorps histone-spécifique. On obtiendra alors l'exact opposé des DNAse-seq et FAIRE-seq, à savoir des reads couvrant l'ADN condensé et non l'inverse. Il est également possible de cibler un facteur de transcription ou tout autre type de protéines de liaison.
Le protocole est assez proche de celui du FAIRE-seq. L'ADN est fixé aux protéines avec du formaldéhyde in vivo, puis est fragmenté par sonification. Ensuite des billes couplées à un anticorps spécifiques capturent les protéines d’intérêt et l'ADN qui y est fixé. Cet ADN est ensuite extrait, purifié, marqué, amplifié et séquencé.
Pour aller plus loin
Acquérir de telles données est une chose, mais utiliser ces données et en tirer quelque chose en est une autre. Alors, que faire une fois que nous avons identifier des régions candidates à la régulation de la transcription ? Une des piste est de chercher dans ces régions des motifs connus d'éléments cis, autrement dit, des séquences reconnues par des facteurs de transcription. Pour cela, il existe des bases de données comme par exemple ChIPBase, qui propose tout un arsenal de données relatives aux ChIP-seq évidemment, mais aussi aux sites de reconnaissances de facteurs de transcription pour six organismes. Une fois qu'on a identifié nos régions et nos facteurs, il nous faut découvrir quels gènes ils régulent, puis enfin reconstruire le réseau de régulation. Bref, il y a de quoi s'amuser pour un bon moment 🙂
Références :
- Song, L., & Crawford, G. E. (2010). DNase-seq : a high-resolution technique for mapping active gene regulatory elements across the genome from mammalian cells. Cold Spring Harbor protocols, 2010(2), pdb.prot5384. doi:10.1101/pdb.prot5384 [lien]
- Zeng, W., & Mortazavi, A. (2012). Technical considerations for functional sequencing assays. Nature immunology, 13(9), 802–7. doi:10.1038/ni.2407 [lien]
- Giresi, P. G., Kim, J., McDaniell, R. M., Iyer, V. R., & Lieb, J. D. (2007). FAIRE (Formaldehyde-Assisted Isolation of Regulatory Elements) isolates active regulatory elements from human chromatin. Genome research, 17(6), 877–85. doi:10.1101/gr.5533506 [lien]
- Park, P. J. (2009). ChIP-seq : advantages and challenges of a maturing technology. Nature reviews. Genetics, 10(10), 669–80. doi:10.1038/nrg2641 [lien1] [lien 2]
- http://en.wikipedia.org/wiki/ChIP-sequencing
- http://en.wikipedia.org/wiki/FAIRE-Seq
Merci à Nisaea, Yoann M. et nallias pour leur relecture.
Crédit image : Isabelle Stévant, licence Art Libre.
Laisser un commentaire