Analyses bioinformatiques du coronavirus 2019-nCoV : pourquoi et comment ?

À l'époque de paru­tion de cet article, le nou­veau nom de la pneu­mo­nie de Wuhan 'COVID-19' et le nom défi­ni­tif du virus 'SARS-CoV‑2' n'étaient pas connus. C'est pour­quoi vous trou­ve­rez encore dans l'article ci-des­sous l'ancien nom 2019-nCoV.

Ce n'est plus un secret : à l'heure où ces lignes sont écrites le coro­na­vi­rus, 2019-nCoV de son petit nom scien­ti­fique, est en train de se pro­pa­ger dans le monde entier.

"Novel Coro­na­vi­rus nCoV" par AJC1 (CC BY-SA 2.0)

La famille des coro­na­vi­rus étant par­ti­cu­liè­re­ment connue pour son pou­voir de muta­tion rapide [réf. 1], la psy­chose s'installe petit à petit dans nos têtes et on se voit déjà conta­mi­né. Mais heu­reu­se­ment nous dis­po­sons de deux armes poten­tiel­le­ment létales pour ce micro pré­da­teur : la Science et la com­mu­ni­ca­tion.

En termes de Science nous allons nous inté­res­ser plus par­ti­cu­liè­re­ment à notre science : la bio-infor­ma­tique. Nous ne nous aven­tu­re­rons pas trop sur le domaine de la viro­lo­gie, lais­sons ça aux experts de ce domaine (l'excellente vidéo de Tania Louis étant déjà un super point de départ [réf. 2]). Vous allez com­prendre com­ment, avec un cas concret comme celui de cette épi­dé­mie de coro­na­vi­rus, nos apti­tudes de bio-infor­ma­ti­ciens pour­ront, on l'espère, aider à sau­ver des vies.

La com­mu­ni­ca­tion arrive ensuite en second plan puisqu'elle s'avèrera utile une fois le tra­vail scien­ti­fique effec­tué afin de dif­fu­ser les consignes et les remèdes au plus grand nombre de nos sem­blables.

Comment identifier le virus ?

Fort des expé­riences récentes du pas­sé (SRAS, fièvre por­cine) la com­mu­nau­té scien­ti­fique a cette fois-ci dégai­née les armes assez rapi­de­ment. En effet dès mi-décembre 2019, à la suite des pre­mières annonces à pro­pos d'un poten­tiel nou­veau virus émergent depuis la ville de Wuhan en Chine et l'isolation de ce virus, les bio­lo­gistes et bio­in­for­ma­ti­ciens se sont lan­cés dans le séquen­çage du virus. En termes de répar­ti­tion des tâches : les bio­lo­gistes ont réa­li­sé le séquen­çage en lui-même et les bio­in­for­ma­ti­ciens se sont occu­pés de l'assemblage du génome du virus. Il faut noter que les tech­niques de séquen­çage sont main­te­nant bien maî­tri­sées : le coût et le délai d'obtention des reads à ali­gner ont dras­ti­que­ment chu­té ces der­nières années.

A titre d'exemple le San­ger Ins­ti­tut annonce d'ailleurs séquen­cer plus de 3000 génomes humains par semaine doré­na­vant ! Début 2019 ils n'en étaient "qu'à" 1000 par semaine (infor­ma­tion trou­vable dans leur bro­chure annuelle), c'est dire comme la tech­no­lo­gie avance rapi­de­ment. Pré­ci­sion utile : un génome humain est bien plus gros qu'un génome viral !
En revanche, mal­gré cette rapi­di­té il est impor­tant de noter que les pre­miers séquen­çage du 2019-nCoV sont chi­nois et que leur fia­bi­li­té est pas mal cri­ti­quée. C'est d'ailleurs assez étrange car ils sont vrai­ment com­pé­tant en géné­ral (beau­coup de labo­ra­toires fran­çais font envoyer leurs échan­tillons à séquen­cer en Chine par exemple).

Mais pour en reve­nir à nos mou­tons, le séquen­çage du virus a sur­tout per­mis d'affirmer que l'on avait bien à faire à un nou­veau virus ! Car aucune concor­dance n'a été trou­vée en com­pa­rant son génome avec ceux pré­sents dans la banque mon­diale des virus connus à ce jour. Atten­tion, cela ne veut pas dire qu'on est face à un génome com­plè­te­ment neuf, mais sim­ple­ment que mal­gré une séquence proche d'autres coro­na­vi­rus, il est suf­fi­sam­ment dif­fé­rent pour qu'on consi­dère qu'il s'agisse d'une nou­velle souche. De plus, même un virus déjà connu ne coïn­ci­de­rait pas exac­te­ment à 100% à son génome consen­sus. Cela en rai­son de ses muta­tions aléa­toires ponc­tuelles.
D'après cette source [réf. 3] le 2019-nCoV serait iden­tique à 70% au virus de SRAS (contre 79,5% d'après la [réf. 5]) mais ce n'est pas assez pour affir­mer que c'est bien le SRAS ou une de ses muta­tions. Alors à par­tir de quel seuil peut-on affir­mer que nous sommes en pré­sence d'un virus connu ? Là encore, et comme d'habitude en bio­lo­gie : ça dépend. Mais si on veut abso­lu­ment avoir une réponse, et qu'on s'aide des études scien­ti­fiques déjà parues [réf. 4], alors cer­tains s'accordent à dire qu'aux alen­tours de 30% de dif­fé­rence de séquences et de symptômes/​réponses au trai­te­ment dif­fé­rentes c'est consi­dé­ré comme dif­fé­rent.

Nous retien­drons sur­tout qu'il aura fal­lu en tout et pour tout seule­ment 12 jours après l'alerte pour que le génome soit révé­lé : 29 903 bases et 10 gènes le com­po­se­rait. À par­tir de là c'était donc acté : il por­te­rait le doux nom de 2019-nCoV. 2019 pour l'année de la décou­verte et nCoV pour novel CoronaVirus.

D'où vient le coronavirus 2019-nCoV ?

Main­te­nant qu'il avait une iden­ti­té et une famille, il fal­lait lui trou­ver une ori­gine.

Le virus a été décla­ré pour la pre­mière fois à proxi­mi­té d'un mar­ché ali­men­taire de Wuhan en Chine. La pre­mière hypo­thèse s'est donc orien­tée vers une trans­mis­sion du coro­na­vi­rus d'un ani­mal à un homme via des vec­teurs clas­siques : mor­sure, consom­ma­tion de viande conta­mi­née… Mais ce n'est qu'une hypo­thèse et il faut la confir­mer ou la réfu­ter.

Pour en être cer­tains, les bio­in­for­ma­ti­ciens ont fait appel à la puis­sance de la phy­lo­gé­nie : ali­gne­ments mul­tiples de séquences et arbres phy­lo­gé­né­tiques à la clé. Nous avions déjà par­lé du choix des meilleurs outils d'alignement et du mode de cal­cul de la conser­va­tion mais nous avions aus­si déjà expli­qué com­ment construire et inter­pré­ter des arbres phy­lo­gé­né­tiques pour ceux que ça inté­res­se­rait.

Cela a per­mis de cibler géo­gra­phi­que­ment le type de souche du coro­na­vi­rus. 2019-nCoV s'est ain­si révé­lé proche de la souche humaine de SARS de 2002 et de souches voi­sines chez des ani­maux (ici des chauves sou­ris, Rhi­no­lo­phus affi­nis). Le réser­voir de ceux-ci se trou­vant en Chine et le pre­mier cas en étant ori­gi­naire, il était assez rai­son­nable d'affirmer que ce lieu était l'origine de 2019-nCoV [réf. 5].

En ce qui concerne l'hôte pro­bable juste avant l'homme, nous avions déjà des exemples connus du fait des anciennes épi­dé­mies de coro­na­vi­rus (géné­ra­le­ment des mam­mi­fères comme les chauves-sou­ris ou encore les dro­ma­daires). Mais une étude de scien­ti­fiques chi­nois semble affir­mer que cette fois cet hôte inter­mé­diaire serait le ser­pent. Les tra­vaux ont beau­coup fait par­ler (et vendre) puisque ce serait la pre­mière fois qu'un coro­na­vi­rus serait trans­mis d'un mam­mi­fère à un être vivant non-mam­mi­fère (en plus à sang froid) et que ce même être vivant aurait ensuite pu le trans­mettre à un mam­mi­fère. De plus, la méthode phy­lo­gé­nique uti­li­sée par ces cher­cheurs ne serait pas approu­vée par l'ensemble de la com­mu­nau­té. Il s'agit donc de res­ter pru­dent sur cette infor­ma­tion.

mème 2019-nCoV for­te­ment ins­pi­ré de celui de Mick Wat­son

Pour ce qui est de l'espèce d'origine du 2019-nCoV on reste alors encore à l'état d'hypothèses. Il est fort pro­bable que la réponse nous arrive après la paru­tion de cet article (le 5 février 2020), les com­pa­rai­sons de génomes ou de mor­ceaux de génomes inter-espèces pou­vant être assez longues.

Grâce aux pou­voirs du séquen­çage et de la phy­lo­gé­nie nous sommes main­te­nant capables d'affirmer que ce nou­veau coro­na­vi­rus vient bien de Chine. On sait aus­si grâce à nos amis viro­lo­gistes qu'il a été sûre­ment trans­mis à l'homme par un ani­mal (mor­sure, consom­ma­tion de viande crue ou mau­vaise cuis­son).

Cela per­met déjà de connaître le foyer de départ et donc de le mettre en qua­ran­taine, mais aus­si de deman­der à la popu­la­tion d'éviter de consom­mer de la viande crue.

Der­nière pré­ci­sion sur l'importance géo­gra­phique : c'est sur­tout impor­tant de savoir s'il y a une adé­qua­tion entre le pays/​la région où la souche a été détec­tée chez un patient et le pays/​la région où elle est appa­rue dans la nature. Sous enten­du, est-ce qu'en plus de la Chine (qui pour­rait n'être qu'un foyer secon­daire) il exis­te­rait un autre pays d'où pro­vien­drait la souche et qu'il fau­drait éga­le­ment mettre en qua­ran­taine ?

Que faire avec ces informations scientifiques sur le nouveau coronavirus de Wuhan ?

La pre­mière chose louable que la com­mu­nau­té scien­ti­fique a réa­li­sé très rapi­de­ment : le par­tage d'information. Notons quand même pour nous bio­in­for­ma­ti­ciens qui appré­cions télé­char­ger l'ensemble d'un génome, que le GISAID a pla­cé sous embar­go les dif­fé­rents génomes ayant pu être séquen­cés. Si on veut un génome com­plet, on pour­ra quand même avoir accès à une ver­sion mais qui date d'avant le nom­mage du coro­na­vi­rus en 2019-nCoV [réf 6]. Mieux que rien diront les opti­mistes.

Les séquences du 2019-nCoV sont par­ta­gées libre­ment sur la pla­te­forme du NCBI ain­si donc qu'un génome com­plet. Cela per­met à n'importe qui, mais bon sur­tout aux cher­cheurs quand même, de récu­pé­rer ces séquences et de pou­voir tra­vailler des­sus pour essayer de trou­ver une faille au virus.

On ne sait pas s'ils sont par­tis de ces don­nées, mais les viro­lo­gistes de l'Institut Pas­teur (pour ne citer qu'eux, coco­ri­co oblige) ont déve­lop­pé assez rapi­de­ment un test diag­nos­tique pour confir­mer la conta­mi­na­tion d'un patient au coro­na­vi­rus de Wuhan. Il est à noter aus­si qu'ils ont réus­si à iso­ler le coro­na­vi­rus 2019-nCoV depuis les pre­miers patients fran­çais de manière extrê­me­ment rapide et que cela a aus­si per­mis le séquen­çage de son génome com­plet. Nous pou­vons vrai­ment être fier de nos équipes de recherches fran­çaises ! Je vous conseille d'ailleurs vive­ment de (re)visionner leur confé­rence de presse du 31 jan­vier 2020 sur le sujet qui est extrê­me­ment inté­res­sante et riche en infor­ma­tion [réf. 7].

D'autres ont pu réa­li­ser un état des muta­tions obser­vées sur les dif­fé­rents patients diag­nos­ti­qués dans le monde, le visuel sur cette appli­ca­tion web est vrai­ment sym­pa­thique.

On parle main­te­nant d'un éven­tuel vac­cin thé­ra­peu­tique qui pour­rait arri­ver dans les 6 pro­chains mois [réf. 8]. La dif­fi­cul­té pour un tel vac­cin est que les coro­na­vi­rus mutent rapi­de­ment. La psy­chose gran­dit encore un peu quand on sait que plus le virus reste long­temps "dans" une espèce, plus ses muta­tions peuvent être dan­ge­reuse pour l'espèce.

À par­tir de là on peut aus­si savoir si le génome du coro­na­vi­rus code pour cer­taines pro­téines de sur­face qui peuvent ser­vir d'antigènes pour ce futur vac­cin, ou de récep­teur d'entrée dans les cel­lules, d'enzymes per­met­tant la répli­ca­tion de l'ARN du virus [réf. 9]

Une autre équipe de scien­ti­fiques s'est lan­cée sur la piste de la pro­téase du virus lui per­met­tant d'entrer dans les cel­lules [réf. 10] en ten­tant de la modé­li­ser à par­tir des don­nées dis­po­nibles. Leur article de blog est pas­sion­nant tant en termes bio­in­for­ma­tique qu'en terme de décou­vertes scien­ti­fiques, je vous le conseille vive­ment.

On pour­rait aus­si s'orienter vers d'autres pistes de thé­ra­pies, un consor­tium de cher­cheurs anglo-suisses s'orientant d'ailleurs vers l'utilisation … du sucre (de la cyclo­dex­trine en réa­li­té) comme arme anti-coro­na­vi­rus !

En atten­dant ce poten­tiel remède, d'autres bio­in­for­ma­ti­ciens plus orien­tés sur la modé­li­sa­tion de l'épidémie ont pu aider en pro­po­sant des modèles pré­di­ci­tifs de conta­mi­na­tion. On peut par exemple consul­ter cette carte inter­ac­tive de pro­pa­ga­tion du 2019-nCoV pour consta­ter l'avancée en qua­si temps réel du coro­na­vi­rus chi­nois. Elle est ali­men­tée tous les jours par les scien­ti­fiques du monde entier.

Les pre­miers résul­tats com­mencent d'ailleurs à tom­ber et on sait main­te­nant que le foyer pré­cis de l'épidémie à Wuhan n'est pas le mar­ché ali­men­taire puisque le pre­mier patient connu n'y a jamais mis les pieds [réf. 11].

Le séquen­çage de 2019-nCoV a aus­si per­mi d'affirmer qu'il n'y a eu qu'un seul point d'entrée chez l'humain, puis des conta­mi­na­tions humain-humain par la suite ! [réf. 5, again !]

Ce n'est que le début des décou­vertes et elles ne sont là que grâce au tra­vail de par­tage exem­plaire des infor­ma­tions d'un pays à un autre.
Enfin pour suivre le dérou­lé de l'histoire autre­ment que via les médias qui ont ten­dance à tra­ves­tir la réa­li­té, je vous encou­rage à vous rendre de temps en temps sur la page Wiki­pé­dia du coro­na­vi­rus 2019-nCoV qui ne cesse d'être ali­men­tée au fur et à mesure des avan­cées. Cette page est d'ailleurs nour­rie selon un pro­ces­sus de review sem­blable à celui des jour­naux scien­ti­fiques.

Si vous sou­hai­tez suivre les articles scien­ti­fiques sor­tis autour du coro­na­vi­rus, un col­lec­tif (TheEye​.eu) s'est for­mé et a consti­tué un recueil de plu­sieurs mil­liers de publi­ca­tions.

.

Notice infor­ma­tive impor­tante :

À ce jour (celui de la publi­ca­tion de cet article) nCov-2019 n'est dan­ge­reux que pour les per­sonnes fra­giles (bébés, agés, immu­no­dé­pri­més, etc.). En cas de doute de si on est atteint ou non, il faut :

  • 1) rela­ti­vi­ser : les chances que vous ayez une grippe sai­son­nière (qui elle a déjà tué plu­sieurs dizaines de per­sonnes en France) sont bien plus impor­tantes que celles d'avoir le coro­na­vi­rus (qui lui, mal­gré 6 cas en France, n'a encore tué per­sonne sur l'hexagone)
  • 2) por­ter un masque (adap­té) pour pré­ve­nir la conta­mi­na­tion des autres (conseil valable pour coro­na­vi­rus comme tout autre mala­die au pas­sage)
  • 3) télé­pho­ner à son méde­cin trai­tant plu­tôt que d'aller conta­mi­ner tout le monde dans une salle d'attente. On entre éga­le­ment dans l'époque des consul­ta­tions vidéo, pensez‑y !
  • 4) ne pas aller aux urgences ! Et ce pour les mêmes rai­sons que la salle d'attente bien évi­dem­ment. Dans le pire des cas votre méde­cin trai­tant vous y adres­se­ra si néces­saire.

Références de l'article :

1 — Le pou­voir de muta­tion d'un virus
2 — vidéo Réponses à vos ques­tions sur le nou­veau coro­na­vi­rus de Tania LOUIS, Doc­teure en viro­lo­gie et créa­trice de conte­nus péda­go­giques, chaîne You­Tube épo­nyme
3 — The conti­nuing 2019-nCoV epi­de­mic threat of novel coro­na­vi­ruses to glo­bal health — The latest 2019 novel coro­na­vi­rus out­break in Wuhan, Chi­na
4 — Defi­ning viral spe­cies : making taxo­no­my use­ful
5 — Mining coro­na­vi­rus genomes for clues to the outbreak’s ori­gins
6 — Wuhan sea­food mar­ket pneu­mo­nia virus iso­late Wuhan-Hu‑1, com­plete genome
7 — Confé­rence de presse du 31/​01/​2020 de l'Institut Pas­teur sur le 2019-nCoV
8 — The­ra­peu­tic Drugs Tar­ge­ting 2019-nCoV Main Pro­tease by High-Through­put Scree­ning
9 — The novel coro­na­vi­rus 2019 (2019-nCoV) uses the SARS-coro­na­vi­rus recep­tor ACE2 and the cel­lu­lar pro­tease TMPRSS2 for entry into tar­get cells
10 — Wuhan coro­na­vi­rus 2019-nCoV — what we can find out on a struc­tu­ral bio­in­for­ma­tics level
11 — Cli­ni­cal fea­tures of patients infec­ted with 2019 novel coro­na­vi­rus in Wuhan, Chi­na

Je tiens à adres­ser un énorme mer­ci à mes relec­teurs sans qui cet article aurait été beau­coup moins bien fice­lé et vrai­ment moins inté­res­sant. Tout par­ti­cu­liè­re­ment à Gwe­naëlle pour ses nom­breuses remarques per­ti­nentes (je l'ai d'ailleurs ajou­té en co-auteur tant son tra­vail de pré-publi­ca­tion a été impor­tant), à Guillaume pour ses remarques et ses liens d'intérêts sur le sujet et à Kevin pour m'avoir relu tout sim­ple­ment 🙂

Cré­dit image : "Novel Coro­na­vi­rus nCoV" par AJC1



Pour continuer la lecture :


Commentaires

Laisser un commentaire