Nombreux parmi nous se retrouvent un jour en fin de master/thèse ou postdoc de bioinformatique. A ce moment là, dans les difficultés de la recherche d'emplois on vient à se demander : "Et si je postulais à toutes ces offres de data scientist ?"
Dans ces lignes, je vais donner mon avis de manière libre, sur pourquoi à mon sens c'est possible.
Il n'existe pas un seul profil de bioinformaticien
On va se poser une petite minute et réfléchir tous ensemble à nos amis bioinformaticiens, nos collègues et sur nous même. En quoi somme-nous des bioinformaticiens ? Nous avons tous des compétences en statistiques, en représentation des données (le mot clef sur le CV c'est 'data vizualisation'), en analyse big data (merci les données OMICS), en programmation/base de donnée et en biologie.
Dans votre formation avez-vous vu un seul parcours standard ?
Surprise, je crois que non, au moins sur les anciennes générations. Peut être que les nouvelles générations de formations sortent des centaines de jeunes qui ont tous fait la même Licence et le même Master. Mais de mon temps de petit vieux de 30 ans (cherchez l'erreur), personne n'avait la même Licence arrivé en Master. Certains avaient des Licences de mathématiques, d'autre de biologie, d'autre d'informatique, voire des Licences directement de biostat/biomath/bioinfo**.
Dans cette GRANDE palette de profils, nous avons tous nos sensibilités : être plus proche des stats, de la biologie, du code à toujours tester un nouveau langage. Mais OUI, nous sommes tous un peu statisticien (ASSUMEZ LE !), un peu informaticien et un peu modélisateur, un peu ! Certains auteurs de ce blog ont des compétences en visualisation de donnée exceptionnelles***, et ce sont des bioinformaticiens !
Si rien que dans notre corps de métier nous avons du mal à nous définir, alors imaginez un peu a quel point cela doit être dur pour tous ces métiers de la data relativement récents (data scientist, data engineer).
Donc le seul conseil que j'aurais à donner est le suivant : si vous avez fait pendant un stage des analyses statistiques sur des données en grande dimension, vous avez le droit de valoriser cette expérience comme une expérience de 'data analyst' ! Ce conseil peut sembler simple, mais les mots clefs entre les deux communautés comme le format de CV ne sont pas toujours les mêmes, à vous de mettre en valeur votre expérience avec des mots qui au fond veulent dire la même chose.
Tous les métiers de la data ont des compétences communes (on est tous des datas trucs)
Si l'on jouait à définir les métiers de data scientist, data manager, data engineer, data analyst, bioinformaticien, computationnal biologist, biostatisticien ? Nous verrions un point simple : chacun de ces métiers se base sur des briques communes.
On parle statistique, mathématique, algorithmique, modélisation (physique ?), et informatique. La différence réside sur à quel point nos compétences sont avancées dans ces différentes briques. Cela va définir les grands types de postes sur lesquels il est possible de candidater. A cela il faut bien sûr ajouter une expertise données TRÈS forte selon les profils.
Nos connaissance de la Biologie sont des connaissances dans un certain système de données. Cependant, les outils utilisés peuvent parfaitement être appliqués dans d'autres contextes. Cela nous donne une capacité à évoluer professionnellement qu'il ne faut pas négliger.
On pourrait même pousser le vice et se dire que un bioinformaticien est une fusion d'un statisticien et d'un informaticien gestionnaire de big data (data engineer / data scientist). La partie statistique nous sert pour les représentations de nos données, les modélisations, et la gestion de big data pour ramasser tout ce que les biologistes ont récolté comme data. Donc en fait, nous sommes les hybrides de plusieurs compétences. Celles-ci sont les mêmes que l'on retrouve chez les data scientist. Par essence nous sommes donc tous, un peu data scientist et data engineer, statisticien, et biologiste de formation.
Dans le texte 'Statistical Modeling : The Two Cultures' de Léo Breiman on retrouve le message suivant : un scientifique pour faire de la Science se doit d'utiliser une large palette d'outils.
Les outils de data scientist et statisticien sont à mon sens les mêmes, seule la culture des communautés change. Il suffit de taper sur son moteur de recherche préféré 'statistician vs data scientist' pour comprendre que le débat ne converge pas vers une seule réponse.
La culture de bioinformaticien est quelque part dans cette zone la preuve avec l'excellent billet de OMGenomics sur le sujet. Le data scientist fait du machine learning (des stats chuuut) ou du deep learning, le bioinformaticien aussi et de plus en plus, donc nous sommes des collègues voir les mêmes personnes selon les endroits.
Conclusion : je suis un rédacteur très biaisé !
Un lecteur bien avisé comprendra que ma perception est biaisée par un jugement très simple. Je ne me considère ni data scientist ni bioinformaticien, ni statisticien d'ailleurs, mais un peu tout à la fois. Je me fiche profondément de quelle étiquette me mettre et elle change selon l'humeur du moment. Pour moi une seule chose compte : les compétences pour exécuter les missions que l'on souhaite réaliser****.
Chaque métier est on évolution constante, ce qui inclue le notre. Il faut CONSTAMMENT apprendre de nouveaux langages, améliorer ses compétences en R / Python / le nouveau langage à la mode. Celui qui dira le contraire et qui refuse d'apprendre une nouvelle technologie de temps en temps prend des risques certains pour sa suite professionnelle. Dans cette perspective, nous pouvons parfaitement candidater à tout ce que l'on veut ! La condition c'est que nos compétences correspondent aux demandes de l'offre qui est devant nous. Nos métiers sont des métiers techniques avec une palette d'outils assez large pour ne pas correspondre à une seule étiquette. Il faut seulement garder la motivation pour toujours apprendre de nouvelles techniques et savoir suivre l'évolution de ce qui est fait. Pour ça, les formations en ligne sont légions en cette époque. De plus, c'est un atout de taille pour montrer sa motivation !
En fait, si il y avait une seule question à se poser se serait : "Est ce que je fais de la bioinformatique car j'aime la biologie de toute mon âme ? Ou car j'aime modéliser des systèmes et être proche des données ? Est ce que je pourrais très bien travailler sur d'autres sujets et que finalement ce que j'aime, c'est être interdisciplinaire?" Si vous restez accroché a votre animal préféré 'blabla la biologie des insectes c’est important !' c'est que vous n’êtes qu’un biologiste déguisé ;).
Petite note de fin pour les petits curieux. Après une thèse et un post doc en bionformatique, j'ai trouvé une place en tant que data scientist dans une entreprise. Première semaine de boulot, premier sujet qui me tombe dessus, le problème consistait à faire du clustering sur une matrice de distance, ça vous rappelle quelque chose amis bioinformaticiens ? Ca ressemble aux parties techniques de votre métiers ? OUI CAR NOUS SOMMES TOUS DES DATAS TRUCS !
Merci à nos bons relecteurs désignés volontaires de la semaine : Yo, Guillaume Devailly et Sebastien Gradit.
Merci à nos bons admins de toujours supporter ma plume et mon caractère de bisounours mielleux et grognons. Kumquatum, Zazo0o et Yo :).
Petit merci supplémentaire à Gaëlle Lelandais qui m'a inspiré ce billet dans une discussion fortuite dans le tramway de Paris.
** Avis de corporatiste bonjour : Lyon 1, vous êtes les meilleurs.
*** Je vous en supplie, écrivez des articles j'en ai marre de citer Billbis :).
**** Le premier qui hurle le mot PROJET peut sortir, l'article est fini :).
Laisser un commentaire