- Le blog participatif de bioinformatique francophone depuis 2012 -

La transcriptomique spatiale

Non, on ne va pas par­tir faire du RNA-seq dans la sta­tion spa­tiale inter­na­tio­nale, ras­su­rez-vous. Je vais vous par­ler de cette (rela­ti­ve­ment) nou­velle tech­nique qui per­met en une seule expé­rience de mesu­rer l'expression des gènes et de loca­li­ser cette expres­sion dans un organe plus ou moins com­plexe.

Pour faire une ana­lyse à large échelle du niveau d'expression des gènes dans un tis­su, rien ne vaut la trans­crip­to­mique. D'abord déve­lop­pée avec la tech­no­lo­gie microar­ray (ou puce à ADNc), elle s'est main­te­nant démo­cra­ti­sée avec le RNA-seq grâce à l’avènement du séquen­çage à haut débit. Depuis quelques années, la trans­crip­to­mique en cel­lule unique (ou single-cell RNA-seq) a explo­sé, et chaque semaine voit son lot d'articles scien­ti­fiques avec un nou­vel atlas trans­crip­to­mique d'un organe ou même d'un orga­nisme dif­fé­rent. Grâce à ces deux tech­niques, on obtient une infor­ma­tion plus ou moins pré­cise du trans­crip­tome des cel­lules d'un tis­su, mais quid de la loca­li­sa­tion de l'expression de ces gènes ? Sont-ils expri­més dans une région spé­ci­fique ou bien un peu par­tout ? Les tech­niques de trans­crip­to­miques, que ce soit en bulk (mélange de plein de cel­lules), ou en cel­lule unique, sont des­truc­tives et ne per­mettent pas de recons­ti­tuer une carte spa­tiale de l'expression des gènes.

Lorsque l'on sou­haite regar­der où un gène est expri­mé dans un organe, nous n'avons pas le choix que de retour­ner à la paillasse, puis au micro­scope. Plu­sieurs tech­niques existent : l'hybri­da­tion in situ et ses déri­vés qui vont recon­naître l'ARN du ou des gènes recher­chés, ou l'immu­no­his­to­chi­mie qui va recon­naître les pro­téines pro­duites par le ou les gènes recher­chés (dans le cas d'un gène codant). Ces tech­niques ont lar­ge­ment fait leurs preuves et sont uti­li­sées en rou­tine dans les labo­ra­toires. Néan­moins, la plus grosse limite de ces tech­niques réside dans le nombre de gènes que l'on sou­haite obser­ver (rare­ment plus de 3 gènes en même temps).

Expression du gène Sox9 dans le rein embryonnaire de souris
Expres­sion du gène Sox9 dans le rein embryon­naire de sou­ris (à 15,5 jours de ges­ta­tion). À gauche, une hybri­da­tion in situ de l'ARN de Sox9 (en vio­let) sur l'organe entier. Au milieu, une hybri­da­tion in situ de l'ARN de Sox9 sur une sec­tion de l'organe. À droite, une immu­no­his­to­fluo­res­cence de la pro­téine SOX9 (en rouge) sur une sec­tion de l'organe (les noyaux de cel­lules sont colo­rés au DAPI et affi­chés en gris). (Source Gud​map​.org)

En 2016, une équipe de cher­cheurs sué­doise a mis au point une tech­nique hybride, mêlant his­to­lo­gie, microar­ray, et tech­niques de cap­ture d'ARN uti­li­sées en single-cell RNA-seq. Ils ont ain­si réa­li­sé pour la pre­mière fois une carte 2D de l'expression des gènes à l'échelle d'un organe (papier).

Com­ment ça fonc­tionne ? Le prin­cipe est (presque) simple. Dans un pre­mier temps, on pré­pare une lame en verre sur laquelle on va géné­rer une grille de spots d'oligonucléotides, à la manière des microar­rays. La grille fait un peu plus de 6mm de côté (non, on ne peut pas y pla­cer un foie de vache… Je vous l'accorde, c'est très petit…), com­prend un peu plus de 1000 spot, et chaque spot com­prend envi­ron 200 mille d'oligos (ces chiffres ont sûre­ment été amé­lio­rés depuis). Chaque oli­go­nu­cléo­tide est com­po­sé d'une suc­ces­sion de codes barres, codés en séquences nucléo­ti­diques. Le pre­mier code barre code pour les coor­don­nées du spot sur la grille, il est donc com­mun à tous les oli­gos d'un même spot, mais est dif­fé­rent des autres spots de la grille. Le second code barre est ce qu'on appelle un UMI, pour Unique Mole­cu­lar Iden­ti­fier, qui est unique à cha­cun des oli­gos. Il per­met­tra plus tard de mieux quan­ti­fier l'expression des gènes. Et enfin, un oli­go poly-(dT), c'est-à-dire d'une suc­ces­sion de T, qui per­met de cap­tu­rer les ARN mes­sa­ger par leur queue poly‑A.

Lame de transcriptomique spatiale
Lame de trans­crip­to­mique spa­tiale.

L'organe que l'on sou­haite étu­dier devra être pré­pa­ré en amont, fixé, cryo­gé­ni­sé, puis décou­pé en fine lamelle d'environ 10µm d'épaisseur (l'épaisseur peut varier selon les pro­to­coles). Ces tranches d'organes vont ensuite être dépo­sées sur les grilles d'oligonucléodides. La lame ain­si obte­nue pour­ra être pho­to­gra­phiée en micro­sco­pie pour se rap­pe­ler de com­ment il a été posi­tion­né par exemple.

Vient ensuite la "magie" de la tech­nique. Les cel­lules de la tranche du tis­su vont être per­méa­bi­li­sées, ce qui va per­mettre à leur ARN de migrer vers la lame, et ain­si être cap­tu­rés par les oli­go­nu­cléo­tides. Chaque ARN mes­sa­ger cap­tu­rés par les oli­gos vont ensuite être reverse-trans­cripts pour obte­nir de l'ADN com­plé­men­taire.

Libération des ARN messagers
Libé­ra­tion des ARN mes­sa­gers.

Com­ment se passe en détail cette trans­crip­tion inverse ? Pour bien com­prendre com­ment les codes barres sont conser­vés dans l'ADN com­plé­men­taire, il faut com­prendre com­ment fonc­tionne une PCR. L'ADN poly­mé­rase va recon­naître l'oligonucléotide comme séquence amorce, et va com­men­cer à syn­thé­ti­ser la séquence com­plé­men­taire de l'ARN cap­tu­ré à la suite de l'oligo(dT). Le brin nou­vel­le­ment syn­thé­ti­sé com­pren­dra alors le code-barre spa­tiale, l'UMI (le code-barre molé­cu­laire), plein de T, puis la séquence de l'ARN mes­sa­ger.

Synthèse de l'ADN complémentaire.
Syn­thèse de l'ADN com­plé­men­taire com­pre­nant les codes-barres.

Ces ADNc vont être libé­rés de la lame, puis ampli­fiés, et pré­pa­rés pour le séquen­çage. Évi­dem­ment, à cette étape, tous les ADNc vont se mélan­ger, mais c'est pas grave, vu qu'ils portent des codes barres.

Vient ensuite le séquen­çage. Il ne s'agit pas ici d'un séquen­çage de RNA-seq clas­sique. Il s'agit d'un séquen­çage en 3'-end. C'est-à-dire que l'on ne va séquen­cer que l'extrémité 3' de nos ARN mes­sa­ger. Le séquen­çage se fait en pai­red-end. Le pre­mier read va lire les codes-barre d'un côté, et le second read va lire dans la séquence de l'ARN, approxi­ma­ti­ve­ment à 300 paires de bases de la queue poly‑A, ce qui suf­fit lar­ge­ment à iden­ti­fier le trans­crit.

Après avoir lu toutes les séquences, on va recons­truire vir­tuel­le­ment la grille de la lame grâce aux codes barres spa­tiaux, et ain­si recons­truire la carte spa­tiale de l'expression de (presque) tous gènes de l'organe étu­dié.

Carte spatiale d'un bulbe olfactif de souris.
Carte spa­tiale d'un bulbe olfac­tif de sou­ris. (Source)

Les cher­cheurs à l'origine de cette tech­nique ont ensuite créé une star­tup pour com­mer­cia­li­ser les lames, star­tup qui a depuis été rache­tée par la com­pa­gnie 10x Geno­mics.

Cette tech­nique n'est pas encore très uti­li­sée, car elle reste très coû­teuse, et assez limi­tée. Comme dit plus haut, la taille de la grille est très petite, donc l'organe à étu­dier doit soit être tout petit, soit être décou­pé et pla­cé sur plu­sieurs grilles. De plus, les spots de chaque grille sont assez espa­cés les uns des autres. L'espace centre à centre entre deux spots est de 200µm dans la publi­ca­tion ori­gi­nale, soit beau­coup plus gros qu'une cel­lule (~10µm), ce qui fait que la réso­lu­tion de la carte ain­si obte­nue est gros­sière, ce qui peut être un vrai pro­blème lorsque l'organe d'intérêt est très com­plexe. Cette tech­no­lo­gie est encore très jeune et conti­nue à être amé­lio­rée. Nous pou­vons espé­rer dans les années à venir un agran­dis­se­ment de la taille de la grille mais aus­si une aug­men­ta­tion de la den­si­té des spots afin d'obtenir des cartes trans­crip­to­miques haute réso­lu­tion.

Mer­ci aux relec­teurs Guillaume Devailly, Aurel, et lhtd pour leurs remarques construc­tives.




Commentaires

Laisser un commentaire