Accessibility Tools

- Le blog participatif de bioinformatique francophone depuis 2012 -

Single-cell sequencing : le séquençage à la cellule près

Cellules d'oignon (CC BY Scphillips)
Cel­lules d'oignon (CC BY Scphil­lips)

Dans la grande famille du séquen­çage, on dis­tingue le DNA­seq et le RNA­seq. Le pre­mier cap­ture la séquence d'ADN conte­nue dans un orga­nisme, un tis­su, une tumeur. C'est un peu comme décom­pi­ler le code source d'un être vivant pour com­prendre com­ment il fonc­tionne. Le pos­tu­lat de l'ADN est qu'il est sen­sé être le même dans toutes les cel­lules d'un orga­nisme (à part de rares excep­tions). Le RNA­seq, quant à lui, per­met de cap­tu­rer le pro­duit de l'expression des gènes à un moment don­né dans un tis­su spé­ci­fique. En effet, les gènes ne s'expriment  pas de la même manière d'un tis­su à l'autre et éga­le­ment au cours du temps. L'étude du trans­crip­tome per­met de savoir exac­te­ment quels gènes sont expri­més, s'ils sont beau­coup ou peu expri­més, et s'ils sont bien expri­més (si l'ARN est bien fait, de telle sorte qu'il sera fonc­tion­nel).

Le pre­mier point com­mun entre ces deux tech­niques est sans aucun doute le point de départ. Pour faire du séquen­çage, il faut des échan­tillons (et avoir bien pen­sé son expé­rience, évi­dem­ment). On pré­lève des bouts de tis­sus direc­te­ment sur l'organisme (mort ou vivant) et on se lance dans l'extraction de la molé­cule à séquen­cer (ARN ou ADN). Selon le type de tis­su que l'on va pré­le­ver, on va poten­tiel­le­ment extraire un mélange de cel­lules de dif­fé­rents types. Si l'on pré­lève du sang par exemple, ce qui est majo­ri­tai­re­ment le cas des études sur les humains, on va obte­nir au moins 5 types de glo­bules blancs dif­fé­rents, plus les glo­bules rouges (mais ceux-ci n'ont pas d'ADN).

Le résul­tat du séquen­çage de ces cel­lules don­ne­ra une vue glo­bale de la séquence d'ADN de l'individu où l'on va obser­ver les muta­tions trou­vées dans tous ces types cel­lu­laires. Main­te­nant, si l'on veut étu­dier des tumeurs cir­cu­lantes (cel­lules qui se déplacent dans le sang),on ne pour­ra pas savoir quelles cel­lules sont mutées et les­quelles sont nor­males, et donc on ne pour­ra pas inter­pré­ter les résul­tats.

Embryon de souris Sf1-eGFP à 13 jours de gestation. En vers, l'expression du transgène Sf1-eGFP pour un marquage spécifique. (CC BY SA Isabelle Stévant)
Embryon de sou­ris Sf1-eGFP à 13 jours de ges­ta­tion. (CC BY SA Isa­belle Sté­vant)

En matière de RNA­seq, c'est encore pire, si on peut dire. Chaque type cel­lu­laire se dis­tingue par un pro­fil d'expression de gènes bien spé­ci­fiques (bien que l'ADN soit le même). Si l'on mélange plu­sieurs types cel­lu­laires, on va obte­nir un mélange d'ARN dont on ne sau­ra pas dis­tin­guer l'origine. On obser­ve­ra l'expression de gènes mais on ne sau­ra pas dire s'ils sont expri­més dans un type de cel­lule en par­ti­cu­lier, ou s'ils sont expri­més un peu chez tout le monde… Selon le but de votre ana­lyse cela peut deve­nir extrê­me­ment pro­blé­ma­tique. Quand on a la chance de tra­vailler sur des orga­nismes modèles de labo­ra­toire (bac­té­ries, dro­so­philes, sou­ris, rats, pois­sons, etc…), on peut géné­rer des orga­nismes trans­gé­niques chez les­quels on a intro­duit un gène mar­qué qui pro­duit une molé­cule fluo­res­cente (cf. l'embryon de sou­ris vert à droite). On choi­si le gène à mar­quer en fonc­tion de la spé­ci­fi­ci­té de son expres­sion. Il faut que ce gène ne s'exprime que dans le tis­su ou le type cel­lu­laire qui nous inté­resse. Ensuite, on peut extraire les cel­lules fluo par cyto­mé­trie en flux et hop, on ne séquence que les cel­lules qui nous inté­ressent. Mais quand on tra­vaille sur les humains, com­ment fait-on ?

L'autre para­mètre à prendre en compte quand on veut faire du séquen­çage est la quan­ti­té de maté­riel néces­saire. Pour un RNA­seq par exemple il faut envi­ron 200ng d'ARN pour un répli­cat, soit pas moins de 40 000 cel­lules (si je ne me trompe pas). Vous vous ima­gi­nez que, dans ces condi­tions, on ne peut pas séquen­cer des ovules ou des stades très pré­coces d'embryons…

En résu­mé, le DNA­seq et le RNA­seq, pour la plu­part des études, c'est déjà très bien. Mais lorsque l'on veut étu­dier des phé­no­mènes extrê­me­ment pré­cis ou que l'on est limi­té niveau quan­ti­té de maté­riel, les tech­niques tra­di­tion­nelles révèlent leurs limites. Mais comme le disent les Sha­doks, s'il n'y a pas de solu­tion c'est qu'il n'y a pas de pro­blème ! Et la solu­tion ici tient en trois mots : Single Cell Sequen­cing.

Sur le papier, le prin­cipe est simple. On isole des cel­lules indi­vi­duel­le­ment, on extrait l'ADN ou l'ARN, on ampli­fie une pre­mière fois l'ADN ou l'ARN pour obte­nir assez de l'ADNc, et hop, on passe aux étapes clas­siques de la pré­pa­ra­tion de séquen­çage : pré­pa­ra­tion des librai­ries, deuxième étape d'amplification et séquen­çage en lui même.

Dans la pra­tique, ce n'est mal­heu­reu­se­ment pas aus­si simple. La grosse dif­fi­cul­té est d'extraire les cel­lules et de les iso­ler, et ça, ce n'est pas une mince affaire. Plu­sieurs tech­niques existent, mais cha­cune a ses incon­vé­nients (cf. tableau), à vous de choi­sir celle qui vous convient en fonc­tion de vos moyens. Pour l'amplification, il doit main­te­nant exis­ter des kits avec des pro­duits bien dosés qui feront le tra­vail pour vous.

[table]Méthode,Débit,Coût,Manuel/Automatique
Micromanipulation,Lent,Faible,Principalement manuel
Fluo­res­cence-acti­va­ted cell sor­ting (FACS),High-throughput,Elevé,Automatique
Laser-cap­ture micro­dis­sec­tion,Lent,Elevé,Manuel
Micro­flui­dics,High-throughput,Elevé,Automatique
[/​table]

L'analyse de don­nées Single-cell ne s'appréhende pas tout à fait comme une ana­lyse clas­sique. On va certes uti­li­ser la bat­te­rie de logi­ciels habi­tuelle, mais il faut plus de points de contrôle. En géné­ral, en paral­lèle du single-cell, on pro­cède à un RNA­seq (ou DNA­seq) total du même tis­su dont ont été extraites nos cel­lules afin d'avoir une réfé­rence. Ce RNA­seq (ou DNA­seq) total ser­vi­ra de base pour contrô­ler la qua­li­té de vos single-cell et aus­si pour confir­mer ou infir­mer l'expression de cer­tains gènes. Dans le meilleurs des cas, vous aurez mul­ti­pléxé vos séquen­çages, autre­ment dit, lors de la pré­pa­ra­tion des librai­ries, les ADNc ont été mar­qués avec un code barre propre à chaque cel­lule, puis les ADNc sont mélan­gés et séquen­cés ensemble. Le mul­ti­plexage per­met de séquen­cer plus de choses et à moindre coût vu qu'on rem­plit au mieux le séquen­ceur. Si vous êtes dans ce cas, vous pour­rez "poo­ler" les reads des single-cell ensemble pour avoir un simi­li RNA­seq total et vous en ser­vir pour faire une esti­ma­tion du bruit obte­nu. En effet, vu que l'on part avec une quan­ti­té réduite d'ARN (ou ADN), deux étapes d'amplification sont néces­saires (au lieu d'une seule nor­ma­le­ment). L'amplification peut créer des biais dans vos don­nées et il est impor­tant d'en avoir conscience, sur­tout quand on fait du single-cell. D'ailleurs, à cause de ces bruits géné­rés par une grosse ampli­fi­ca­tion, il va être dif­fi­cile d'analyser de manière très fine l'expression de gènes fai­ble­ment expri­més.

Le second sou­ci du single-cell, c'est la  varia­bi­li­té de l'expression entre les cel­lules, même de type iden­tique. De prime abord, on pour­rait s'attendre à avoir des pro­fils d'expression assez simi­laires d'une cel­lule à une autre, sur­tout quand il s'agit du même type. Or, il faut savoir que ce n'est pas tout à fait le cas. Si vous savez que par­mi vos cel­lules il y a plu­sieurs types cel­lu­laires, mais vous ne savez pas qui est quoi, vous devrez pas­ser par une étape de sélec­tion d'un set de gènes que vous savez plus ou moins spé­ci­fiques à tel ou tel type cel­lu­laire. Vous pour­rez ensuite pro­cé­der à un clus­te­ring hié­rar­chique (et/​ou ACP) de vos échan­tillons pour les clas­ser en fonc­tion de la manière dont elles expriment ces gènes. Si vous vous lan­cez dans ce type d'analyses sans sélec­tion­ner au préa­lable un set de gènes, il y a peu de chance que vous réus­sis­siez à clas­ser cor­rec­te­ment vos cel­lules (ça sent le vécu, non ? 😉 ).

Clustering de 4 single-cell RNAseq (a- expression des gènes; b- distance euclidienne) (CC BY SA Isabelle Stévant
Clus­te­ring hié­rar­chique de 4 single-cell RNA­seq (a- expres­sion des gènes ; b- dis­tance eucli­dienne) (CC BY SA Isa­belle Sté­vant)

Cette tech­nique apporte avec elle son lot de com­pli­ca­tions, néan­moins le single-cell sequen­cing per­met une ana­lyse géno­mique et trans­crip­to­mique à l'échelle d'une seule cel­lule et per­met d'affiner encore et tou­jours plus nos connais­sances. Avec ce pro­cé­dé, il devient pos­sible d'estimer la varia­bi­li­té intra-tis­su­laire, d'étudier des stades embryon­naires pré­coces, de décor­ti­quer la com­po­si­tion des tumeurs ou même encore de retra­cer les lignées cel­lu­laires au cours du déve­lop­pe­ment.

 Réfé­rences :

  • Single-cell sequen­cing-based tech­no­lo­gies will revo­lu­tio­nize whole-orga­nism science [lien]
  • Tra­vaux per­son­nels

Mer­ci à Wocka, et Yoann M. pour la relec­ture.

Vous avez aimé ? Dites-le nous !

Moyenne : 0 /​ 5. Nb de votes : 0

Pas encore de vote pour cet article.

Partagez cet article




Commentaires

2 réponses à “Single-cell sequencing : le séquençage à la cellule près”

  1. Avatar de Gringop@ko
    Gringop@ko

    Super article, très clair !
    Je suis vrai­ment impres­sion­né par ce type d'approche et rêve­rai un peu de pou­voir un jour faire du single cell sequen­cing. Ayant lu un article par­ti­cu­liè­re­ment inté­res­sant à ce sujet, la méthode a per­mis, via une approche FACS + illu­mi­na sequen­cing, l'identification d'un génome qua­si com­plet d'une bac­té­rie non culti­vable, fai­sant par­tie d'un phy­lum (TM6) dont tous les repré­sen­tant sont éga­le­ment non culti­vables.
    J'ai pu me rendre compte de la por­tée de ce tra­vail dans un cadre micro­bio­lo­gique, et c'est impres­sion­nant !

    http://​www​.pnas​.org/​c​o​n​t​e​n​t​/​e​a​r​l​y​/​2​0​1​3​/​0​6​/​0​5​/​1​2​1​9​8​0​9​1​1​0​.​s​h​ort

  2. […] Cel­lules d'oignon (CC BY Scphil­lips) Dans la grande famille du séquen­çage, on dis­tingue le DNA­seq et le RNA­seq. Le pre­mier cap­ture la séquence d'ADN conte­nue dans un orga­nisme, un tis­su, une tumeur.  […]

Laisser un commentaire

Pour insérer du code dans vos commentaires, utilisez les balises <code> et <\code>.