De bioinformaticien à data scientist, un simple pas ?

Nom­breux par­mi nous se retrouvent un jour en fin de master/​thèse ou post­doc de bio­in­for­ma­tique. A ce moment là, dans les dif­fi­cul­tés de la recherche d'emplois on vient à se deman­der : "Et si je pos­tu­lais à toutes ces offres de data scien­tist ?"
Dans ces lignes, je vais don­ner mon avis de manière libre, sur pour­quoi à mon sens c'est pos­sible.

Petite pro­vo­ca­tion volon­taire for­te­ment ins­pi­rée d'autres des­sins qui per­met d'illustrer mon pro­pos

Il n'existe pas un seul profil de bioinformaticien

On va se poser une petite minute et réflé­chir tous ensemble à nos amis bio­in­for­ma­ti­ciens, nos col­lègues et sur nous même. En quoi somme-nous des bio­in­for­ma­ti­ciens ? Nous avons tous des com­pé­tences en sta­tis­tiques, en repré­sen­ta­tion des don­nées (le mot clef sur le CV c'est 'data vizua­li­sa­tion'), en ana­lyse big data (mer­ci les don­nées OMICS), en programmation/​base de don­née et en bio­lo­gie.

Dans votre for­ma­tion avez-vous vu un seul par­cours stan­dard ?
Sur­prise, je crois que non, au moins sur les anciennes géné­ra­tions. Peut être que les nou­velles géné­ra­tions de for­ma­tions sortent des cen­taines de jeunes qui ont tous fait la même Licence et le même Mas­ter. Mais de mon temps de petit vieux de 30 ans (cher­chez l'erreur), per­sonne n'avait la même Licence arri­vé en Mas­ter. Cer­tains avaient des Licences de mathé­ma­tiques, d'autre de bio­lo­gie, d'autre d'informatique, voire des Licences direc­te­ment de biostat/​biomath/​bioinfo**.
Dans cette GRANDE palette de pro­fils, nous avons tous nos sen­si­bi­li­tés : être plus proche des stats, de la bio­lo­gie, du code à tou­jours tes­ter un nou­veau lan­gage. Mais OUI, nous sommes tous un peu sta­tis­ti­cien (ASSUMEZ LE !), un peu infor­ma­ti­cien et un peu modé­li­sa­teur, un peu ! Cer­tains auteurs de ce blog ont des com­pé­tences en visua­li­sa­tion de don­née excep­tion­nelles***, et ce sont des bio­in­for­ma­ti­ciens !

Si rien que dans notre corps de métier nous avons du mal à nous défi­nir, alors ima­gi­nez un peu a quel point cela doit être dur pour tous ces métiers de la data rela­ti­ve­ment récents (data scien­tist, data engi­neer).
Donc le seul conseil que j'aurais à don­ner est le sui­vant : si vous avez fait pen­dant un stage des ana­lyses sta­tis­tiques sur des don­nées en grande dimen­sion, vous avez le droit de valo­ri­ser cette expé­rience comme une expé­rience de 'data ana­lyst' ! Ce conseil peut sem­bler simple, mais les mots clefs entre les deux com­mu­nau­tés comme le for­mat de CV ne sont pas tou­jours les mêmes, à vous de mettre en valeur votre expé­rience avec des mots qui au fond veulent dire la même chose.

Tous les métiers de la data ont des compétences communes (on est tous des datas trucs)

Si l'on jouait à défi­nir les métiers de data scien­tist, data mana­ger, data engi­neer, data ana­lyst, bio­in­for­ma­ti­cien, com­pu­ta­tion­nal bio­lo­gist, bio­sta­tis­ti­cien ? Nous ver­rions un point simple : cha­cun de ces métiers se base sur des briques com­munes.
On parle sta­tis­tique, mathé­ma­tique, algo­rith­mique, modé­li­sa­tion (phy­sique ?), et infor­ma­tique. La dif­fé­rence réside sur à quel point nos com­pé­tences sont avan­cées dans ces dif­fé­rentes briques. Cela va défi­nir les grands types de postes sur les­quels il est pos­sible de can­di­da­ter. A cela il faut bien sûr ajou­ter une exper­tise don­nées TRÈS forte selon les pro­fils.
Nos connais­sance de la Bio­lo­gie sont des connais­sances dans un cer­tain sys­tème de don­nées. Cepen­dant, les outils uti­li­sés peuvent par­fai­te­ment être appli­qués dans d'autres contextes. Cela nous donne une capa­ci­té à évo­luer pro­fes­sion­nel­le­ment qu'il ne faut pas négli­ger.

On pour­rait même pous­ser le vice et se dire que un bio­in­for­ma­ti­cien est une fusion d'un sta­tis­ti­cien et d'un infor­ma­ti­cien ges­tion­naire de big data (data engi­neer /​ data scien­tist). La par­tie sta­tis­tique nous sert pour les repré­sen­ta­tions de nos don­nées, les modé­li­sa­tions, et la ges­tion de big data pour ramas­ser tout ce que les bio­lo­gistes ont récol­té comme data. Donc en fait, nous sommes les hybrides de plu­sieurs com­pé­tences. Celles-ci sont les mêmes que l'on retrouve chez les data scien­tist. Par essence nous sommes donc tous, un peu data scien­tist et data engi­neer, sta­tis­ti­cien, et bio­lo­giste de for­ma­tion.

Dans le texte 'Sta­tis­ti­cal Mode­ling : The Two Cultures' de Léo Brei­man on retrouve le mes­sage sui­vant : un scien­ti­fique pour faire de la Science se doit d'utiliser une large palette d'outils.
Les outils de data scien­tist et sta­tis­ti­cien sont à mon sens les mêmes, seule la culture des com­mu­nau­tés change. Il suf­fit de taper sur son moteur de recherche pré­fé­ré 'sta­tis­ti­cian vs data scien­tist' pour com­prendre que le débat ne converge pas vers une seule réponse.
La culture de bio­in­for­ma­ti­cien est quelque part dans cette zone la preuve avec l'excellent billet de OMGe­no­mics sur le sujet. Le data scien­tist fait du machine lear­ning (des stats chuuut) ou du deep lear­ning, le bio­in­for­ma­ti­cien aus­si et de plus en plus, donc nous sommes des col­lègues voir les mêmes per­sonnes selon les endroits.

Conclusion : je suis un rédacteur très biaisé !

Un lec­teur bien avi­sé com­pren­dra que ma per­cep­tion est biai­sée par un juge­ment très simple. Je ne me consi­dère ni data scien­tist ni bio­in­for­ma­ti­cien, ni sta­tis­ti­cien d'ailleurs, mais un peu tout à la fois. Je me fiche pro­fon­dé­ment de quelle éti­quette me mettre et elle change selon l'humeur du moment. Pour moi une seule chose compte : les com­pé­tences pour exé­cu­ter les mis­sions que l'on sou­haite réa­li­ser****.

Chaque métier est on évo­lu­tion constante, ce qui inclue le notre. Il faut CONSTAMMENT apprendre de nou­veaux lan­gages, amé­lio­rer ses com­pé­tences en R /​ Python /​ le nou­veau lan­gage à la mode. Celui qui dira le contraire et qui refuse d'apprendre une nou­velle tech­no­lo­gie de temps en temps prend des risques cer­tains pour sa suite pro­fes­sion­nelle. Dans cette pers­pec­tive, nous pou­vons par­fai­te­ment can­di­da­ter à tout ce que l'on veut ! La condi­tion c'est que nos com­pé­tences cor­res­pondent aux demandes de l'offre qui est devant nous. Nos métiers sont des métiers tech­niques avec une palette d'outils assez large pour ne pas cor­res­pondre à une seule éti­quette. Il faut seule­ment gar­der la moti­va­tion pour tou­jours apprendre de nou­velles tech­niques et savoir suivre l'évolution de ce qui est fait. Pour ça, les for­ma­tions en ligne sont légions en cette époque. De plus, c'est un atout de taille pour mon­trer sa moti­va­tion !

En fait, si il y avait une seule ques­tion à se poser se serait : "Est ce que je fais de la bio­in­for­ma­tique car j'aime la bio­lo­gie de toute mon âme ? Ou car j'aime modé­li­ser des sys­tèmes et être proche des don­nées ? Est ce que je pour­rais très bien tra­vailler sur d'autres sujets et que fina­le­ment ce que j'aime, c'est être inter­dis­ci­pli­naire?" Si vous res­tez accro­ché a votre ani­mal pré­fé­ré 'bla­bla la bio­lo­gie des insectes c’est impor­tant !' c'est que vous n’êtes qu’un bio­lo­giste dégui­sé ;).

Petite note de fin pour les petits curieux. Après une thèse et un post doc en bion­for­ma­tique, j'ai trou­vé une place en tant que data scien­tist dans une entre­prise. Pre­mière semaine de bou­lot, pre­mier sujet qui me tombe des­sus, le pro­blème consis­tait à faire du clus­te­ring sur une matrice de dis­tance, ça vous rap­pelle quelque chose amis bio­in­for­ma­ti­ciens ? Ca res­semble aux par­ties tech­niques de votre métiers ? OUI CAR NOUS SOMMES TOUS DES DATAS TRUCS !

Mer­ci à nos bons relec­teurs dési­gnés volon­taires de la semaine : Yo, Guillaume Devailly et Sebas­tien Gra­dit.
Mer­ci à nos bons admins de tou­jours sup­por­ter ma plume et mon carac­tère de bisou­nours miel­leux et gro­gnons. Kum­qua­tum, Zazo0o et Yo :).

Petit mer­ci sup­plé­men­taire à Gaëlle Lelan­dais qui m'a ins­pi­ré ce billet dans une dis­cus­sion for­tuite dans le tram­way de Paris.

** Avis de cor­po­ra­tiste bon­jour : Lyon 1, vous êtes les meilleurs.

*** Je vous en sup­plie, écri­vez des articles j'en ai marre de citer Bill­bis :).

**** Le pre­mier qui hurle le mot PROJET peut sor­tir, l'article est fini :).



Pour continuer la lecture :


Commentaires

2 réponses à “De bioinformaticien à data scientist, un simple pas ?”

  1. Avatar de Audrey

    Post hyper-bien­ve­nu sur­tout en période de rédac­tion de CV, mer­ci !

    Et par rap­port à ** : MIV fore­veeeeeer ! J'ai bien rigo­lé le jour où j'ai appris que le M était pour Modé­li­sa­tion parce que Mathé­ma­tiques fai­sait trop peur aux bio­lo­gistes en tran­si­tion (c'est drôle parce que c'est vrai!)

    1. Je me retrouve à 100% dans ce billet.

      Ayant du mal a sta­bi­li­ser ma situa­tion en bioin­fo "clas­sique", j'ai sau­té le pas de l'autre côté du miroir.

      Pen­dant l'entretien, je raconte mon par­cours, en quoi consiste la bio­in­for­ma­tique et je conclue en disant qu'en gros je suis "ingé­nieur data spé­cia­li­sé dans la bio". La per­sonne en face de moi me demande alors "ah mais vous savez, la data, c'est large comme domaine ! Vous êtes quoi ? Data scien­tist, engi­neer, ana­lyst, plu­tôt orien­té data viz … ?" et la seul réponse que j'ai trou­vé c'est oui !

      Il y a clai­re­ment un monde qui sépare les bioin­fo des IT "conven­tion­nel" : le jar­gon tech­nique, les méthodes de tra­vails, la ges­tion de pro­jet (sur­tout quand on vient de l'academique) etc … Mais une fois qu'on a enle­vé l'emballage, une fois devant son écran, on fait bel et bien la même chose !

      Enfin, c'est ce que je pense, pour ma part je décou­vri­rais ça en sep­tembre.

      Mer­ci pour le par­tage, c'est cool de se sen­tir moins seul ^^

Laisser un commentaire