Accessibility Tools

- Le blog participatif de bioinformatique francophone depuis 2012 -

Comment l'étude des intensités d'expression de gène a évolué avec les technologies de transcriptomique ?

Cet article est en par­tie basé sur mon intro­duc­tion de thèse [0], refor­ma­tée pour conve­nir au for­mat du blog et agré­men­tée des nou­velles infor­ma­tions pour ne pas être un simple cata­logue de connais­sances.


Qu'il s'agisse du génome entier, du génome de tis­sus ou du génome de cel­lules spé­ci­fiques, l'étude de la quan­ti­té de trans­crits pro­duits, ou trans­crip­tome, a per­mis à la recherche en bio­lo­gie et bioin­fo de mieux com­prendre le fonc­tion­ne­ment basal et sain de ces enti­tés [1,2].

Un rapide historique

L'ARN est une de ces molé­cules bio­lo­giques casse-pieds : sa sta­bi­li­té est faible et sa dégra­da­tion rapide en rai­son des nom­breuses enzymes de dégra­da­tion la ciblant dans et hors de la cel­lule. Alors les pre­mières tech­no­lo­gies de trans­crip­to­mique ont donc rare­ment ciblé les ARN en eux-mêmes et ont plu­tôt construit des ADN com­plé­men­taires (ADNc) de leurs séquences à l'aide de trans­crip­tases inverses décou­vertes en 1970 [3].

Ces pre­mières tech­no­lo­gies furent basées sur les mar­queurs de séquences expri­mées (expres­sed sequence tags en anglais ou EST), de courtes séquences d'ADNc iden­ti­fiantes de trans­crits qu'on détec­tait ensuite par migra­tion sur gel. Déve­lop­pés au début des années 70, les EST ont ser­vi de base à la méthode SAGE (Serial Ana­ly­sis of Gene Expres­sion) créée en 1995 [4] qui ana­lyse les EST conca­té­nés via le séquen­çage San­ger (le fameux qu'on nous rabâche en cours) lui-même inven­té en 1975 [5]. Cette tech­nique de séquen­çage alors très popu­laire à l'époque [6] est dite rétros­pec­ti­ve­ment de bas débit et a per­mis les pre­miers séquen­çages de trans­crip­tome par­tiels [7] ou com­plets pour des orga­nismes à ARN de petite taille comme le bac­té­rio­phage MS2 [8]. La quan­ti­fi­ca­tion par réac­tion en chaine d'ARN retro-trans­po­sé (RT-qPCR de l'anglais reverse trans­crip­tion quan­ti­ta­tive poly­me­rase chain reac­tion) com­bi­née à un buvar­dage de nor­thern​*​ (en anglais nor­thern­blot) fut éga­le­ment uti­li­sée à par­tir de la fin des années 80 en rai­son de sa grande pré­ci­sion [9].

L'utilisation de SAGE et de RT-qPCR dans l'étude de l'expression de gènes a tou­te­fois dimi­nué pro­gres­si­ve­ment au pro­fit de nou­velles tech­no­lo­gies capables de quan­ti­fier un plus grand nombre de trans­crits simul­ta­né­ment [10]. Les puces à ADN par hybri­da­tion (en anglais hybri­di­za­tion-based microar­rays) ont ain­si été pri­sés dès le milieu des années 90 [11] après la com­mer­cia­li­sa­tion de la pre­mière puce Affi­me­trix [12] en rai­son de leur faible rap­port coût sur trans­crits quan­ti­fiés.

Cepen­dant, face à la contrainte des puces à ADN de devoir connaître les séquences des trans­crits à quan­ti­fier, la tech­no­lo­gie du RNA-seq (séquen­çage de l'ARN, RNA sequen­cing en anglais) est deve­nue un incon­tour­nable dans nombre d'études. Pro­fi­tant de l'amélioration des tech­no­lo­gies de séquen­çage géno­mique via tou­jours une trans­crip­tion inverse de l'ARNm en ADNc, la tech­no­lo­gie du RNA-seq va émer­ger dans les années 2000 et est pro­mu comme révo­lu­tion­naire [13]. Pour­tant, sa men­tion dans une publi­ca­tion n'arrivera fina­le­ment qu'en 2008 [14] bien qu'elle soit uti­li­sée dans des études dès 2006 [15]. La baisse pro­gres­sive de son coût (non je ne remet­trai pas cette figure que tout le monde connaît), la rapi­di­té du pro­ces­sus et l'équipement pro­gres­sif des labo­ra­toires avec des auto­mates va alors la rendre incon­tour­nable.

Figure 1Évo­lu­tion de l'utilisation des dif­fé­rentes tech­niques de trans­crip­to­mique en se basant sur le nombre de publi­ca­tions les men­tion­nant. Les résul­tats pro­viennent de Pub­Med avec les requêtes sui­vantes au 13/​08/​2021 : EST = "cDNA libra­ry" OR "cDNA libra­ries" OR "com­ple­men­ta­ry DNA libra­ry" OR "com­ple­men­ta­ry DNA libra­ries" OR "expres­sed sequence tag" OR "expres­sed sequence tags", Puce à ADN = "micro array" OR "microar­ray" NOT "chro­mo­so­mal", RNA-seq = "RNA Seq" OR "RNA-Seq" OR "RNA­Seq".

Les puces à ADN et le RNA-seq sont encore aujourd'hui les deux tech­no­lo­gies de quan­ti­fi­ca­tion de l'expression des gènes cou­ram­ment uti­li­sées, mal­gré le déclin annon­cé des puces à ADN pour de la quan­ti­fi­ca­tion d'expression (Figure 1). Les bio-informaticien·ne·s sont donc amené·e·s à devoir trai­ter et ana­ly­ser les don­nées issues de ces deux approches en tenant compte des pro­prié­tés bio­lo­giques, tech­niques et sta­tis­tiques res­pec­tives à cha­cune des deux tech­no­lo­gies.

Les technologies en quelques mots

Il existe de nom­breuses varia­tions d'une même tech­no­lo­gie (euphé­misme si on compte les solu­tions mai­son [16]) et il est ain­si impos­sible de toutes les pré­sen­ter dans cet humble article. Voi­ci donc une ver­sion géné­rale pour cha­cune d'entre elle.

Les puces à ADN

S'il existe une ver­sion de géno­ty­page des puces à ADN, c'est bien la ver­sion de quan­ti­fi­ca­tion de l'expression des gènes qui nous inté­resse ici. Pour obte­nir cette infor­ma­tion, on uti­lise une lame de verre sur laquelle est dépo­sé un ensemble de frag­ments d'ADN nom­més amorces (en anglais probes) dans des puits qui cor­res­pondent aux ARN que l'on sou­haite quan­ti­fier. Les construc­teurs de puces à ADN tels que Affy­me­trix, Illu­mi­na ou Agilent (les plus cou­rants) mettent donc à dis­po­si­tion plu­sieurs modèles de puces conte­nant un ensemble d'amorces pré­dé­fi­nies pour réa­li­ser la quan­ti­fi­ca­tion de l'expression chez un orga­nisme [17].

Figure 2 — Exemple d'une puce à ADN à deux canaux et de ses étapes de pré-trai­te­ment. Modi­fié d'après Petrov et al. [19]

Les trans­crits puri­fiés sont ensuite retro-trans­crits pour être capables de se lier avec les amorces. Au pas­sage on leur ajoute des fluo­ro­chromes pour les repé­rer et les quan­ti­fier plus tard. Cer­taines puces sont pré­vues pour une uti­li­sa­tion avec un seul fluo­ro­chrome (un canal), tan­dis que d'autres per­mettent l'hybri­da­tion de deux échan­tillons (deux canaux) dif­fé­rents tels que deux condi­tions expé­ri­men­tales (sain/​malade, sauvage/​muté [18]). Un détec­teur équi­pé d'un cap­teur de fluo­res­cence va ensuite mesu­rer l'intensité éma­nant de chaque puits et chaque lon­gueur d'onde s'il s'agit d'une puce à deux canaux. Il en résulte une image, ou deux si il y a deux canaux, telle que visible en Figure 2. L'inten­si­té du signal reçue par le cap­teur est ensuite trans­for­mée en inten­si­té d'expression après plu­sieurs cor­rec­tions et nor­ma­li­sa­tion qu'on ne détaille­ra pas dans cet article.

Le RNA-seq

Le pro­to­cole de pré­pa­ra­tion des trans­crits est le même que pour les puces à ADN avec une étape sup­plé­men­taire avant séquen­çage : une ampli­fi­ca­tion par PCR et une frag­men­ta­tion selon la taille requise par la tech­no­lo­gie de séquen­çage.

Figure 3 — Dérou­lé d'une opé­ra­tion de quan­ti­fi­ca­tion d'expression par RNA-seq selon un example pour chaque géné­ra­tion de séquen­çage.

On en dis­tingue deux : la pre­mière et la seconde, per­du, la seconde et la troi­sième (la pre­mière étant asso­ciée aux méthode à base d'EST). Les tech­no­lo­gies de seconde géné­ra­tion dont Illu­mi­na reste très répan­du, consistent à paral­lé­li­ser un très grand nombre d'opérations de séquen­çage de tout trans­crit pré­sent dans l'échantillon. Des frag­ments de petite à moyenne taille (400 bp au maxi­mum) peuvent alors être séquen­cé par dif­fé­rentes méthodes : pyro­sé­quen­çage, ter­mi­na­teur de colo­rant réver­sible, liga­ture en chaîne d'oligonucléotides 8‑mer, etc. Les tech­no­lo­gies de troi­sième géné­ra­tion telles que Pac­Bio ou Nano­pore (Figure 3), quant à elles, uti­lisent encore d'autres méthodes : varia­tion du champ élec­trique de nano­pores, guides d'ondes à mode zéro [20]. La dif­fé­rence avec la seconde géné­ra­tion réside dans la taille de frag­ment séquen­çable bien supé­rieure avec comme contre coup de prendre plus de temps et d'avoir un nombre d'erreurs de lec­tures dis­cu­table.

Conclusion

"Et les autres méthodes de quan­ti­fi­ca­tion de l'expression ?" cer­tains me diront. Car oui, les tech­no­lo­gies pré­sen­tées ici ne sont que les plus clas­siques et cet article ne se veut pas exhaus­tif. Isa­belle nous par­lait ain­si par exemple de la trans­crip­to­mique spa­tiale ou du single-cell sequen­cing sur notre blog.

En atten­dant, voi­là la courte his­toire de com­ment dif­fé­rentes géné­ra­tions de jeux de don­née d'expression de gènes se baladent dans GEO et com­ment vous pou­vez être ame­né à tra­vailler avec. Atten­tion cepen­dant car comme vous vous en dou­tez, cha­cune pos­sède ses propres biais de quan­ti­fi­ca­tion d'expression et doit donc être pré-trai­té dif­fé­rem­ment. On essaie­ra donc dans un pro­chain article de reve­nir sur ce point.

Sources

  • [0] Gwe­naëlle Lemoine, "Déve­lop­pe­ment de méthodes et outils d'analyse trans­crip­to­mique par réseaux de co-expres­sion de gènes pour la détec­tion de gènes can­di­dats dans le vieillis­se­ment de dif­fé­rents tis­sus humains", Thèse Uni­ver­si­té Laval (CA), Dec 2021, https://​hdl​.handle​.net/​2​0​.​5​0​0​.​1​1​7​9​4​/​7​2​645
  • [1] T. R. Hughes et al., “Func­tio­nal Dis­co­ve­ry via a Com­pen­dium of Expres­sion Pro­files,” Cell, vol. 102, pp. 109–126, jul 2000.
  • [2] N. Cloo­nan et al., “Stem cell trans­crip­tome pro­fi­ling via mas­sive-scale mRNA sequen­cing,” Nat. Methods, vol. 5, pp. 613–619, Jul 2008.
  • [3] H. M. Temin and S. Mizu­ta­ni, “Viral RNA-dependent DNA Poly­me­rase : RNA-dependent DNA Poly­me­rase in Virions of Rous Sar­co­ma Virus,” Nature, vol. 226, pp. 1211–1213, Jun 1970.
  • [4] V. E. Vel­cu­les­cu et al., “Serial Ana­ly­sis of Gene Expres­sion,” Science, vol. 270, pp. 484–487, Oct 1995
  • [5] F. San­ger and A. R. Coul­son, “A rapid method for deter­mi­ning sequences in DNA by pri­med syn­the­sis with DNA poly­me­rase,” J. Mol. Biol., vol. 94, pp. 441–448, May 1975
  • [6] M. A. Mar­ra, L. Hil­lier, and R. H. Waters­ton, “Expres­sed sequence tags — ESTa­bli­shing bridges bet­ween genomes,” Trends Genet., vol. 14, pp. 4–7, Jan 1998.
  • [7] P. G. N. Jep­pe­sen et al., “Gene Order in the Bac­te­rio­phage R17 RNA : 5′– ;A Protein–Coat Protein–Synthetase–3′,” Nature, vol. 226, pp. 230–237, Apr 1970.
  • [8] W. Fiers, R. Contre­ras, F. Due­rinck, G. Hae­ge­man, D. Ise­ren­tant, J. Mer­re­gaert, W. M. Jou,
  • F. Mole­mans et al., “Com­plete nucleo­tide sequence of bac­te­rio­phage MS2 RNA : pri­ma­ry and secon­da­ry struc­ture of the repli­case gene,” Nature, vol. 260, pp. 500–507, Apr 1976.
  • [9] M. Becker-André and K. Hahl­brock, “Abso­lute mRNA quan­ti­fi­ca­tion using the poly­me­rase chain reac­tion (PCR). A novel approach by a PCR aided trans­cipt titra­tion assay (PATTY),” Nucleic Acids Res., vol. 17, pp. 9437–9446, Nov 1989.
  • [10] R. Lowe et al., “Trans­crip­to­mics tech­no­lo­gies,” PLoS Com­put. Biol., vol. 13, p. e1005457, May 2017.
  • [11] M. Sche­na et al., “Quan­ti­ta­tive Moni­to­ring of Gene Ex-
  • pres­sion Pat­terns with a Com­ple­men­ta­ry DNA Microar­ray,” Science, vol. 270, pp. 467–470, Oct 1995.
  • [12] T. Lenoir and E. Gian­nel­la, “The emer­gence and dif­fu­sion of DNA microar­ray tech­no­lo­gy,” J. Bio­med. Dis­co­ve­ry Col­lab., vol. 1, p. 11, 2006.
  • [13] Wang, M. Ger­stein, and M. Sny­der, “RNA-Seq : a revo­lu­tio­na­ry tool for trans­crip­to­mics,” Nat. Rev. Genet., vol. 10, pp. 57–63, Jan 2009.
  • [14] U. Naga­laksh­mi et al., “The Trans­crip­tio­nal Land­scape of the Yeast Genome Defi­ned by RNA Sequen­cing,” Science, vol. 320, pp. 1344–1349, Jun 2008.
  • [15] F. Cheung et al., and C. D. Town, “Sequen­cing Medi­ca­go trun­ca­tu­la expres­sed sequen­ced tags using 454 Life Sciences tech­no­lo­gy,” BMC Geno­mics, vol. 7, pp. 1–10, Dec 2006.
  • [16] A. Thomp­son et al., “It’s easy to build your own microar­rayer !,” Trends Micro­biol., vol. 9, pp. 154–156, Apr 2001
  • [17] H. Liu, “Microar­ray probes and probe sets,” Fron­tiers in Bios­cience, vol. E2, no. 1, pp. 325–338, 2010.
  • [18] R. Bum­gar­ner, “Over­view of DNA Microar­rays : Types, Appli­ca­tions, and Their Future,” Cur­rent Pro­to­cols in Mole­cu­lar Bio­lo­gy, vol. 101, pp. 22.1.1–22.1.11, Jan 2013
  • [19] A. Petrov and S. Shams, “Microar­ray Image Pro­ces­sing and Qua­li­ty Control,” The. Jour­nal of VLSI Signal Pro­ces­sing-Sys­tems. for Signal, Image, and Video Tech­no­lo­gy, vol. 38, pp. 211–226, Nov 2004
  • [20] Tho­mas P. Nie­drin­ghaus et al., "Land­scape of Next-Gene­ra­tion Sequen­cing Tech­no­lo­gies", Ana­ly­ti­cal Che­mis­try, 2011, vol.83 (12), 4327–4341

Mer­ci à Marion P., Léo­pold Car­ron, et Isa­belle S. pour la relec­ture.


  1. ​*​
    Oui, oui, c'est bien la tra­duc­tion en fran­çais de nor­thern­blot, cf. http://​gdt​.oqlf​.gouv​.qc​.ca/​f​i​c​h​e​O​q​l​f​.​a​s​p​x​?​I​d​_​F​i​c​h​e​=​8​3​9​2​423

Vous avez aimé ? Dites-le nous !

Moyenne : 5 /​ 5. Nb de votes : 3

Pas encore de vote pour cet article.

Partagez cet article



Pour continuer la lecture :


Commentaires

Laisser un commentaire

Pour insérer du code dans vos commentaires, utilisez les balises <code> et <\code>.