Comment détecter, compiler et annoter des facteurs de transcription ?

Tra­vis Jon Alli­son (CC-by-NC-SA)

Après la réunion de ren­trée de tous les contri­bu­teurs du blog, nous avons déci­dé d'étendre la rubrique "Jour­nal Club". Ain­si, il est désor­mais non seule­ment pos­sible mais aus­si for­te­ment recom­man­dé de pro­po­ser des billets dis­cu­tant d'un article en par­ti­cu­lier. Nous inau­gu­rons cette exten­sion avec un sujet pas­sion­nant : la détec­tion de fac­teurs de trans­crip­tion. Bonne lec­ture 🙂

Ce billet résume un article de revue rédi­gé sous forme de tuto­riel et publié récem­ment en tant que pro­to­cole dans Gene Regu­la­to­ry Net­works : "How do you find trans­crip­tion fac­tors ? Com­pu­ta­tio­nal approaches to com­pile and anno­tate reper­toires of regu­la­tors for any genome". Le choix de cet article a été moti­vé par sa forme ori­gi­nale. Il s'agit d'un article à visée clai­re­ment péda­go­gique qui explique point par point com­ment pro­cé­der. Ce billet n'en est qu'un conden­sé. Je vous invite à lire l'article ori­gi­nal si cette mise en bouche vous a plu.

Plus spé­ci­fi­que­ment, cet article vous pro­pose un pro­to­cole per­met­tant de créer un réper­toire de fac­teurs de trans­crip­tion pour un génome don­né (Euca­ryote ou Pro­ca­ryote). Le but d'une telle étude est de mettre en avant l’existence de fac­teurs qui n'auraient pas encore été iden­ti­fiés en se basant sur la recherche de gènes ayant des domaines com­muns avec les familles de fac­teurs de trans­crip­tions déjà connus.

La régu­la­tion de la trans­crip­tion est un des méca­nismes fon­da­men­taux qui contrôlent la quan­ti­té de pro­téines pro­duites par la cel­lule. Cette régu­la­tion dif­fère selon les condi­tions envi­ron­ne­men­tales et le stade de déve­lop­pe­ment de l'organisme. Un vaste panel de pro­téines par­mi les­quelles les ARN poly­mé­rases, les his­tones, les modi­fi­ca­teurs d'histones, les fac­teurs de trans­crip­tion et les co-fac­teurs, est impli­qué dans le main­tient de la pré­ci­sion et de la spé­ci­fi­ci­té du pro­ces­sus de régu­la­tion.

Rôle des fac­teurs de trans­crip­tion dans la régu­la­tion de l'expression génique (Phi­lippe Hupé, CC-by-SA)

Les fac­teurs de trans­crip­tion (ou TF, pour Trans­crip­tion Fac­tor) sont des pro­téines de liai­son à l'ADN qui influent direc­te­ment sur l'expression de gènes en se liant spé­ci­fi­que­ment à des séquences régu­la­trices que l'on appelle pro­mo­teurs. La liai­son d'un TF sur un pro­mo­teur per­met soit d'initier la trans­crip­tion du gène qu'il régule soit, au contraire, d'empêcher son ini­tia­tion.

Cet article décrit une des stra­té­gies pos­sibles pour iden­ti­fier un réper­toire de fac­teurs de trans­crip­tion et pour anno­ter de nou­veaux gènes codant pour un TF, quelque soit l'organisme étu­dié.

Identification d'un répertoire de facteurs de transcription

Kasaa(CC by-nc)

Les gènes qui codent poten­tiel­le­ment pour un fac­teur de trans­crip­tion peuvent être détec­tés par dif­fé­rentes approches infor­ma­tiques. La méthode la plus répan­due est d'utiliser un algo­rithme d'alignement de séquences par paire tel que BLAST pour iden­ti­fier des séquences homo­logues à des fac­teurs de trans­crip­tion connus. Une approche plus pré­cise consiste à cher­cher des gènes conte­nant des domaines de liai­son à l'ADN connus en uti­li­sant des méthodes basées sur la recherche de motifs comme Inter­ProS­can, HMMER et PSI-BLAST. Des outils tels que Inter­Pro, Pfam et SUPERFAMILY per­mettent d'obtenir des modèles de conser­va­tion décri­vant des groupes de domaines ou de régions dont la séquence pro­téique est conser­vée.

Voi­ci étape par étape le pro­to­cole pour iden­ti­fier le réper­toire de fac­teurs de trans­crip­tion pour un génome don­né :

  1. Télé­char­ger une liste de domaines de liai­son à l'ADN (par exemple sur le site du MRC-LMB) ;
  2. Télé­char­ger et ins­tal­ler l'API Inter­ProS­can ;
  3. Télé­char­ger un jeu de don­nées de réfé­rence des pro­téines de l'organisme qui vous inté­resse sur Uni­Prot ;
  4. Lan­cer Inter­ProS­can sur le set de pro­téines en lais­sant les para­mètres par défaut ;
  5. Exa­mi­ner le résul­tat et fil­trer les pro­téines en gar­dant celles qui match avec un des domaines de liai­son à l'ADN (cf. 1.).

Évaluer la couverture du répertoire

Oli­Bac(cc by)

Une fois que vous avez iden­ti­fié les fac­teurs de trans­crip­tion, il est recom­man­dé d'évaluer votre réper­toire en le com­pa­rant à d'autres jeux de don­nées connus pour jau­ger de sa cou­ver­ture. La pre­mière approche consiste à com­pa­rer avec un jeu de don­nées de réfé­rence consti­tué de gènes anno­tés comme fac­teurs de trans­crip­tion dans la base de don­nées Gene Onto­lo­gy (GO, anno­ta­tion "mole­cu­lar func­tion"). Notez bien que ce jeu de don­nées ne consti­tue pas un gold stan­dard, d'autant plus que votre but est d'améliorer la liste des fac­teurs de trans­crip­tion connus. Cette com­pa­rai­son per­met cepen­dant de véri­fier la qua­li­té de votre réper­toire en véri­fiant que les fac­teurs de trans­crip­tion du jeu de don­nées de réfé­rence sont bien inclus dans votre réper­toire.

Attribuer des fonctions de régulation aux facteurs de transcription

JogiBaer2 (CC-By)

Il est pos­sible de déter­mi­ner les pro­ces­sus cel­lu­laires et bio­lo­giques connus pour être régu­lés par votre réper­toire en uti­li­sant des res­sources comme GO, Entrez ou Pub­Med. Pour attri­buer les fonc­tions régu­la­trices à votre réper­toire, voi­ci le pro­to­cole à suivre :

  1. Extraire les anno­ta­tions GO (caté­go­rie "bio­lo­gi­cal pro­cess") de votre réper­toire. Il est pos­sible de res­treindre les anno­ta­tions selon si elles sont expé­ri­men­tales ou infé­rées auto­ma­ti­que­ment ;
  2. Sou­mettre le réper­toire de fac­teurs de trans­crip­tion sur le site g:Profiler pour déter­mi­ner les pro­ces­sus bio­lo­giques qui sont signi­fi­ca­ti­ve­ment enri­chis ;
  3. Éven­tuel­le­ment, recher­cher sur Pub­Med la fonc­tion des TF de votre répertoire0

À ce stade, vous avez une liste de fac­teurs de trans­crip­tion dont cer­tains sont poten­tiel­le­ment incon­nus ; vous savez éga­le­ment (pour la plu­part) quelles sont les fonc­tions qu'ils régulent. La pro­chaine étape consiste donc à les clas­ser.

Classification structurelle des facteurs de transcription

Les fac­teurs de trans­crip­tion sont cou­ram­ment clas­sés en fonc­tion de leur domaine de liai­son à l'ADN. Cette clas­si­fi­ca­tion per­met de retra­cer l'origine des familles de fac­teurs au cours de l'évolution et de com­prendre com­ment ils recon­naissent et se lient aux séquences d'ADN. De plus, l'identité même du domaine de liai­son donne des indi­ca­tions sur la fonc­tion régu­la­trice du TF.

Mesurer l'expression des gènes codant pour les facteurs de transcription

Kat Mas­back (CC-by-SA)

Les jeux de don­nées à grande échelle sur l'expression géné­tique tels que ceux issus de puces à ADN ou de RNA-seq per­mettent de déter­mi­ner des pro­fils d'activité des fac­teurs de trans­crip­tion en fonc­tion des types de cel­lules et des dif­fé­rentes condi­tions. Il est pos­sible de déduire deux types d'information de ces don­nées :

  • l'expression d'un fac­teur de trans­crip­tion dans des cir­cons­tances spé­ci­fiques ren­seigne sur sa fonc­tion en tant que régu­la­teur de cette condi­tion ;
  • l'expression glo­bale du réper­toire de fac­teurs de trans­crip­tion devrait révé­ler l'organisation du sys­tème de régu­la­tion.

En ana­ly­sant ces don­nées, il ne faut pas perdre de vue que beau­coup de ces fac­teurs sont régu­lés de manière post-trans­crip­tion­nelle à tra­vers des modi­fi­ca­tions cova­lentes, des relo­ca­li­sa­tions cel­lu­laires ou bien des oli­go­mé­ri­sa­tions. Dans ce cas, leur expres­sion n'est en aucun cas indi­ca­trice de leur acti­vi­té. De plus, chez les Euca­ryotes, la plu­part des fac­teurs de trans­crip­tion se com­binent à d'autres régu­la­teurs pour être actifs. La connais­sance de ces com­bi­nai­sons est donc indis­pen­sable pour com­prendre l'activité d'un fac­teur de trans­crip­tion et peut consti­tuer une dif­fi­cul­té pour iden­ti­fier le rôle d'un nou­veau fac­teur.

Conclusion

La régu­la­tion de la trans­crip­tion, que ce soit chez les Euca­ryotes ou chez les Pro­ca­ryotes, est un pro­ces­sus com­plexe et consti­tue un sujet de recherche hau­te­ment attrac­tif pour la com­pré­hen­sion des fonc­tions cel­lu­laires. L'étude des fac­teurs de trans­crip­tion com­bi­née aux don­nées d'expression géné­tique per­met d'appréhender les méca­nismes de régu­la­tions et consti­tue un point de départ à d'autres ana­lyses plus pous­sées, soit sur les fac­teurs de trans­crip­tion eux-mêmes, soit sur des réseaux de régu­la­tions géné­tiques par­ti­cu­liers.

Sources :

http://​www​.sprin​ger​link​.com/​c​o​n​t​e​n​t​/​p​8​7​6​2​1​5​8​2​5​7​7​2​g20

http://​atlas​ge​ne​tic​son​co​lo​gy​.org/​E​d​u​c​/​T​F​a​c​t​o​r​s​F​r​.​h​tml

Remer­cie­ments :

Je remer­cie Estel, Mali­cia et Clem_​ pour la relec­ture et les com­men­taires construc­tifs. Mer­ci éga­le­ment à Juan­ma Vaque­ri­zas, pre­mier auteur de l'article que je vous ai pré­sen­té, et avec qui j'ai par­ta­gé mon bureau quelques mois lors d'un stage à l'EBI.



Pour continuer la lecture :


Commentaires

Une réponse à “Comment détecter, compiler et annoter des facteurs de transcription ?”

  1. Avatar de jsobel

    Hel­lo,

    Super article ! Mer­ci pour ces réfé­rences. le livre Sprin­ger à l'air excellent.

    A bien­tôt !

    jso­bel

Laisser un commentaire