La transcriptomique spatiale

14 octobre 2020

-

par

Non, on ne va pas partir faire du RNA-seq dans la station spatiale internationale, rassurez-vous. Je vais vous parler de cette (relativement) nouvelle technique qui permet en une seule expérience de mesurer l'expression des gènes et de localiser cette expression dans un organe plus ou moins complexe.

Pour faire une analyse à large échelle du niveau d'expression des gènes dans un tissu, rien ne vaut la transcriptomique. D'abord développée avec la technologie microarray (ou puce à ADNc), elle s'est maintenant démocratisée avec le RNA-seq grâce à l’avènement du séquençage à haut débit. Depuis quelques années, la transcriptomique en cellule unique (ou single-cell RNA-seq) a explosé, et chaque semaine voit son lot d'articles scientifiques avec un nouvel atlas transcriptomique d'un organe ou même d'un organisme différent. Grâce à ces deux techniques, on obtient une information plus ou moins précise du transcriptome des cellules d'un tissu, mais quid de la localisation de l'expression de ces gènes ? Sont-ils exprimés dans une région spécifique ou bien un peu partout ? Les techniques de transcriptomiques, que ce soit en bulk (mélange de plein de cellules), ou en cellule unique, sont destructives et ne permettent pas de reconstituer une carte spatiale de l'expression des gènes.

Lorsque l'on souhaite regarder où un gène est exprimé dans un organe, nous n'avons pas le choix que de retourner à la paillasse, puis au microscope. Plusieurs techniques existent : l'hybridation in situ et ses dérivés qui vont reconnaître l'ARN du ou des gènes recherchés, ou l'immunohistochimie qui va reconnaître les protéines produites par le ou les gènes recherchés (dans le cas d'un gène codant). Ces techniques ont largement fait leurs preuves et sont utilisées en routine dans les laboratoires. Néanmoins, la plus grosse limite de ces techniques réside dans le nombre de gènes que l'on souhaite observer (rarement plus de 3 gènes en même temps).

Expression du gène Sox9 dans le rein embryonnaire de souris — **Expression du gène *Sox9* dans le rein embryonnaire de souris (à 15,5 jours de gestation).** À gauche, une hybridation *in situ* de l'ARN de *Sox9* (en violet) sur l'organe entier. Au milieu, une hybridation *in situ* de l'ARN de *Sox9* sur une section de l'organe. À droite, une immunohistofluorescence de la protéine SOX9 (en rouge) sur une section de l'organe (les noyaux de cellules sont colorés au DAPI et affichés en gris). (Source Gudmap.org)

En 2016, une équipe de chercheurs suédoise a mis au point une technique hybride, mêlant histologie, microarray, et techniques de capture d'ARN utilisées en single-cell RNA-seq. Ils ont ainsi réalisé pour la première fois une carte 2D de l'expression des gènes à l'échelle d'un organe (papier).

Comment ça fonctionne ? Le principe est (presque) simple. Dans un premier temps, on prépare une lame en verre sur laquelle on va générer une grille de spots d'oligonucléotides, à la manière des microarrays. La grille fait un peu plus de 6mm de côté (non, on ne peut pas y placer un foie de vache… Je vous l'accorde, c'est très petit…), comprend un peu plus de 1000 spot, et chaque spot comprend environ 200 mille d'oligos (ces chiffres ont sûrement été améliorés depuis). Chaque oligonucléotide est composé d'une succession de codes barres, codés en séquences nucléotidiques. Le premier code barre code pour les coordonnées du spot sur la grille, il est donc commun à tous les oligos d'un même spot, mais est différent des autres spots de la grille. Le second code barre est ce qu'on appelle un UMI, pour Unique Molecular Identifier, qui est unique à chacun des oligos. Il permettra plus tard de mieux quantifier l'expression des gènes. Et enfin, un oligo poly-(dT), c'est-à-dire d'une succession de T, qui permet de capturer les ARN messager par leur queue poly-A.

L'organe que l'on souhaite étudier devra être préparé en amont, fixé, cryogénisé, puis découpé en fine lamelle d'environ 10µm d'épaisseur (l'épaisseur peut varier selon les protocoles). Ces tranches d'organes vont ensuite être déposées sur les grilles d'oligonucléodides. La lame ainsi obtenue pourra être photographiée en microscopie pour se rappeler de comment il a été positionné par exemple.

Vient ensuite la "magie" de la technique. Les cellules de la tranche du tissu vont être perméabilisées, ce qui va permettre à leur ARN de migrer vers la lame, et ainsi être capturés par les oligonucléotides. Chaque ARN messager capturés par les oligos vont ensuite être reverse-transcripts pour obtenir de l'ADN complémentaire.

Comment se passe en détail cette transcription inverse ? Pour bien comprendre comment les codes barres sont conservés dans l'ADN complémentaire, il faut comprendre comment fonctionne une PCR. L'ADN polymérase va reconnaître l'oligonucléotide comme séquence amorce, et va commencer à synthétiser la séquence complémentaire de l'ARN capturé à la suite de l'oligo(dT). Le brin nouvellement synthétisé comprendra alors le code-barre spatiale, l'UMI (le code-barre moléculaire), plein de T, puis la séquence de l'ARN messager.

Synthèse de l'ADN complémentaire. — Synthèse de l'ADN complémentaire comprenant les codes-barres.

Ces ADNc vont être libérés de la lame, puis amplifiés, et préparés pour le séquençage. Évidemment, à cette étape, tous les ADNc vont se mélanger, mais c'est pas grave, vu qu'ils portent des codes barres.

Vient ensuite le séquençage. Il ne s'agit pas ici d'un séquençage de RNA-seq classique. Il s'agit d'un séquençage en 3'-end. C'est-à-dire que l'on ne va séquencer que l'extrémité 3' de nos ARN messager. Le séquençage se fait en paired-end. Le premier read va lire les codes-barre d'un côté, et le second read va lire dans la séquence de l'ARN, approximativement à 300 paires de bases de la queue poly-A, ce qui suffit largement à identifier le transcrit.

Après avoir lu toutes les séquences, on va reconstruire virtuellement la grille de la lame grâce aux codes barres spatiaux, et ainsi reconstruire la carte spatiale de l'expression de (presque) tous gènes de l'organe étudié.

Carte spatiale d'un bulbe olfactif de souris. (Source)

Les chercheurs à l'origine de cette technique ont ensuite créé une startup pour commercialiser les lames, startup qui a depuis été rachetée par la compagnie 10x Genomics.

Cette technique n'est pas encore très utilisée, car elle reste très coûteuse, et assez limitée. Comme dit plus haut, la taille de la grille est très petite, donc l'organe à étudier doit soit être tout petit, soit être découpé et placé sur plusieurs grilles. De plus, les spots de chaque grille sont assez espacés les uns des autres. L'espace centre à centre entre deux spots est de 200µm dans la publication originale, soit beaucoup plus gros qu'une cellule (~10µm), ce qui fait que la résolution de la carte ainsi obtenue est grossière, ce qui peut être un vrai problème lorsque l'organe d'intérêt est très complexe. Cette technologie est encore très jeune et continue à être améliorée. Nous pouvons espérer dans les années à venir un agrandissement de la taille de la grille mais aussi une augmentation de la densité des spots afin d'obtenir des cartes transcriptomiques haute résolution.

Merci aux relecteurs Guillaume Devailly, Aurel, et lhtd pour leurs remarques constructives.

Partagez cet article

Isabelle S. (ZaZo0o)

Mi-bio, mi-bioinfo, et re-mi-bio derrière. J'ai suivi une licence de biologie cellulaire et génétique et un master de bioinformatique à l'université de Rennes, puis j'ai travaillé comme ingé d'étude en développement web pendant 1 an et demi. Ensuite, j'ai effectué un doctorat en bioinformatique à l'université de Genève (single-cell RNA-seq, paillasse et analyse), puis un premier postdoc mi-bio mi-bioinfo en épigénomique développementale de la Drosophile à l'IGFL à Lyon. Je suis actuellement en postdoc bioinfo à distance pour l'université de Bar Ilan (Tel Aviv), en collaboration avec l'IGH à Montpellier. J'analyse des données multi-omics pour reconstituer la régulation des gènes lors de la différentiation des gonades chez la souris.

Pour continuer la lecture :

Commentaires

Laisser un commentaireAnnuler la réponse.

Pour insérer du code dans vos commentaires, utilisez les balises <code> et <\code>.