État de l'emploi bioinformatique en France : analyse des offres de la SFBI

wordcloud general des descriptions
Vous recon­nais­sez-vous là dedans ?

Encore une nou­velle jour­née de code qui com­mence, j'ouvre ma boîte et… tiens donc, trois nou­velles annonces de la Socié­té Fran­çaise de Bio­In­for­ma­tique. Ça tombe bien, dans quelques mois je sou­tiens ma thèse, je devrais peut-être com­men­cer à cher­cher du bou­lot. Voyons voir ça… CDD déve­lop­peur web… Post-Doc déve­lop­peur logi­ciel… CDD Ingé­nieur déve­lop­pe­ment logi­ciel… Bon sang, mais y'en a que pour les devs ! C'est à croire que la bioin­fo se limite à ça. Et pas l'ombre d'un CDI en plus ! Mais au fait… Est-ce juste une mau­vaise jour­née, ou est-ce repré­sen­ta­tif de la bioin­fo d'aujourd'hui ? Si seule­ment quelqu'un pou­vait faire une ana­lyse glo­bale de toutes ces offres…

Vous aus­si vous en avez rêvé ? Et bien, bioin­fo-fr l'a fait ! Après tout, quoi de mieux qu'une bande de bio­in­for­ma­ti­ciens pour trai­ter des don­nées sur l'emploi en bio­in­for­ma­tique. Toutes les ques­tions que vous avez pu vous poser sur le mar­ché du tra­vail vont enfin trou­ver réponse aujourd'hui. Et si ce n'était pas le cas ? Devi­nez quoi… On four­nit même le code et les don­nées ! De quoi occu­per vos longues soi­rées en atten­dant des jours meilleurs. Mais regar­dons déjà ce que l'équipe a pu tirer de tout ça. Atten­tion, vous êtes prêts ? C'est par­ti !

Origine des données et disponibilité du code

Comme vous avez bien sûr déjà lu nos articles sur l'insertion pro­fes­sion­nelle des bio­in­for­ma­ti­ciens (ici et ici), vous savez que la SFBI entre­tient une liste qui, entre autres choses, dif­fuse régu­liè­re­ment des offres d'emploi. Depuis 2012, les annon­ceurs ont la pos­si­bi­li­té de dépo­ser leurs offres direc­te­ment sur le site de la SFBI (c'est même deve­nu obli­ga­toire depuis 2014). Ces offres sont déjà en par­tie pré­for­ma­tées (type de contrat, durée, etc) ce qui faci­lite gran­de­ment leur ana­lyse. Nous avons donc concen­tré nos efforts uni­que­ment sur les offres dépo­sées sur le site web.

L'intégralité du code est en Python et se trouve sur un dépôt Github. Son ins­tal­la­tion et son uti­li­sa­tion sont décrites dans le README du pro­jet. Vous ne savez pas encore uti­li­ser git ? Ça tombe bien, on a aus­si un article pour ça. N'hésitez pas à par­ta­ger avec nous vos ana­lyses, ou à pro­po­ser des pull requests avec vos propres graphes.

Le code est accom­pa­gné d'une base de don­nées JSON qui contient, au moment de la rédac­tion de cet article, la qua­si-tota­li­té des offres du site du 23 avril 2012 au 19 février 2016, soit un total de 1289 offres. Les ana­lyses qui suivent sont bien sûr for­te­ment liées à cette base, il convien­dra donc d'être pru­dent si on extra­pole ces résul­tats à l'ensemble du mar­ché de l'emploi en bio­in­for­ma­tique. Elle a de plus été ampu­tée des infor­ma­tions rela­tives aux annon­ceurs (adresse de contact, nom de la boîte, etc), prin­ci­pa­le­ment en reti­rant la des­crip­tion des offres pour ne conser­ver que les méta­don­nées. Nous avons néan­moins géné­ré un nuage de mots à par­tir des des­crip­tions des offres, lequel illustre cet article. On vous laisse tirer vos conclu­sions, mais ce nuage laisse pré­sa­ger d'un mar­ché du tra­vail orien­té vers les data scien­tists, la recherche et les déve­lop­peurs.

Dans ce qui suit, nous allons creu­ser dif­fé­rents aspects de ces offres : les types de contrats, les diplômes exi­gés, la durée des contrats à durée déter­mi­née, et enfin une ana­lyse de tout ça par région. Tous ces graphes sont géné­rés par le fichier global_lins.py et lexical_analysis.py dans le dépôt du pro­jet. D'autres graphes sont dis­po­nibles mais ils ne seront pas com­men­tés dans cet article.

Types de contrats

Les offres contiennent 4 types de contrats, répar­tis de la manière sui­vante :

Répartition des types de contrat

Les CDD repré­sentent plus de la moi­tié des offres (55,1%), sui­vis par les stages (22,1%), les CDI (16,5%) et les thèses (6,3%). Étran­ge­ment, il sem­ble­rait que la liste de la SFBI ne soit pas très uti­li­sée pour dif­fu­ser des offres de thèse, ou alors qu'il soit plus facile de finan­cer un CDD qu'une thèse quand on cherche un bio­in­for­ma­ti­cien.

Les nuages de mots basés sur les titres des offres dans chaque caté­go­rie sont don­nés ci-après.

wordcloud CDD
CDD
wordcloud CDI
CDI
wordcloud thèse
Thèse
wordcloud stage
Stage

Les mots employés dans les titres de CDD et CDI semblent tour­ner autour de la notion d'ingénieur. Pour les stages, les termes "ana­lyse", "don­nées" et "M2" dominent com­plè­te­ment les des­crip­tifs des offres. Pour les thèses, c'est un peu plus dif­fus, mais il sem­ble­rait que l'on cherche pas mal de doc­to­rants en bio­in­for­ma­tique struc­tu­rale.

Le site de la SFBI pro­pose aus­si de défi­nir des sous-caté­go­ries pour les offres de type CDI et CDD. Voi­ci les répar­ti­tions obte­nues pour les CDI…

Répartition des types de CDI

… et pour les CDD :Répartition des types de CDD

On retrouve dans les CDI les caté­go­ries habi­tuelles du milieu aca­dé­mique (IE — Ingé­nieur d'Études, IR — Ingé­nieur de Recherche, MdC — Maître de Confé­rence, CR — Char­gé de Recherche, PR — Pro­fes­seur) et une caté­go­rie "CDI autre" pour tout ce qui ne colle pas dans les caté­go­ries pré­cé­dentes (on s'attend à ce que cette der­nière caté­go­rie contienne notam­ment les offres du sec­teur pri­vé et les offres aca­dé­miques étran­gères). Le milieu aca­dé­mique fran­çais occupe ain­si moins de la moi­tié des CDI publiés sur la SFBI (notons que ce milieu pri­vi­lé­gie sou­vent ses propres pla­te­formes pour la publi­ca­tion des postes).

Les CDD n'ont que 4 caté­go­ries : ATER, Post-doc, CDD autre et CDD Ingé­nieur. Les postes ATER sont si peu repré­sen­tés que nous n'en par­le­rons pas par la suite. On constate que les post-docs occupent la moi­tié de ces offres. Le site de la SFBI semble donc être un lieu de choix pour trou­ver un post-doc, encore faut-t-il que notre domaine soit bien concer­né. Voi­la ce que donne un nuage de mots for­mé à par­tir des titres d'annonces de la sous-caté­go­rie "post-doc".

wordcloud postdoc
Titres des offres de post-doc

C'est fina­le­ment assez varié, allant de l'analyse de don­nées aux bio­sta­tis­tiques en pas­sant par le machine lear­ning. On trouve éga­le­ment la modé­li­sa­tion (model­ling) et le séquen­çage (sequen­cing, ngs) en bonnes posi­tions. Notons que can­cer est la thé­ma­tique bio­lo­gique la plus citée, ce qu'on pou­vait attendre d'un axe de recherche qui reçoit une large part des finan­ce­ments actuels. Enfin, n'oublions pas un des pro­blèmes majeurs révé­lé par cette image : les annon­ceurs sont inca­pables de se déci­der sur la pré­sence du tiret dans le mot post-doc !

Niveaux de diplôme exigés

La grande ques­tion de ces der­nières années : doit-on faire une thèse après un mas­ter ? Y‑a-t-il de la place sur le mar­ché du tra­vail pour des Bac+8 ? La figure sui­vante donne la répar­ti­tion des niveaux d'études exi­gés pour les offres des caté­go­ries CDI et CDD. Atten­tion, les niveaux d'études ont été déduits à par­tir de la sous-caté­go­rie de chaque offre. Les sous-caté­go­ries "CDD autre" et "CDI autre" n'ont donc pas pu être ana­ly­sées (soit 749 offres res­tantes, une fois les stages et thèses éga­le­ment reti­rés).Diplôme requis dans les offres

Comme on peut le voir, il n'y a pas une énorme dif­fé­rence entre les offres qui néces­sitent un doc­to­rat et celles qui se contentent d'un niveau mas­ter, ceci pro­ba­ble­ment grâce à l'abondance de post-docs dans la liste. Il fau­drait cepen­dant réa­li­ser une ana­lyse plus pous­sée sur les caté­go­ries "autre" pour vrai­ment en tirer quelque chose.

Quel est la durée d'un poste CDD en bioinformatique ?

On l'a vu, les CDD dominent plus de la moi­tié des offres. Mais vous vous deman­dez sûre­ment com­bien de temps ces CDD durent : s'agit-il de contrats longs, de contrats courts, ou encore de contrats très courts ? Pour sim­pli­fier, nous les avons répar­tis en tranches de 6 mois. La figure sui­vante ne contient que les offres de la caté­go­rie CDD, c'est-à-dire qu'elle ne contient ni les stages, ni les thèses.

Répartition des durées des CDDOn constate que la majo­ri­té des CDD (44%) ont une durée plu­tôt courte (infé­rieure ou égale à 1 an), dont une petite part est de durée très courte (8% des CDD ont une durée infé­rieure ou égale à 6 mois). Même s'il existe des offres de durées supé­rieures, il sem­ble­rait que la limite légale (2 ans) explique le reste de la répar­ti­tion (43% entre 1 et 2 ans, et seule­ment 14% de plus de 2 ans).

On s'attend évi­dem­ment à ce que ce résul­tat soit biai­sé par l'abondance de cer­tains types de postes. Que donne la dis­tri­bu­tion des durées par type de contrat CDD ? Le graphe ci-des­sous est un vio­lin­plot qui donne une idée de la dis­tri­bu­tion pour chaque caté­go­rie. La ligne ver­ti­cale rouge repré­sente la médiane pour chaque caté­go­rie. Le nombre à droite repré­sente le nombre total d'offres de la caté­go­rie.

Durées des CDD par type de contrat
Dis­tri­bu­tions des durées des offres par type de contrat CDD.

Comme pré­vu, les dis­tri­bu­tions n'ont rien de com­pa­rable. On constate par exemple que les post-docs ont une dis­tri­bu­tion plu­tôt bimo­dale, avec un pic à 1 an et un autre à 2 ans (pro­ba­ble­ment dû au mode de finan­ce­ment). Les contrats de post-doc de moins de 6 mois sont inexis­tants. Même si la dis­tri­bu­tion s'étale vers les durées longues, les post-docs supé­rieurs à 2 ans sont une den­rée très rare, même s'ils ont le mérite (ou pas selon les points de vue) d'exister.

L'essentiel des contrats très courts (de durée infé­rieure à 6 mois) semblent être concen­trés dans les caté­go­ries CDD autre et CDD Ingé­nieur, avec même des contrats pro­po­sés pour des durées de seule­ment 1 mois ! On note­ra cepen­dant qu'il existe aus­si des contrats longs dans ces caté­go­ries.

Répartition des offres sur la France

Nous nous sommes aus­si inté­res­sés à la dis­tri­bu­tion dans l'espace de toutes ces offres : y a‑t-il des inéga­li­tés ter­ri­to­riales concer­nant l'emploi bio­in­for­ma­tique en France ? Les deux graphes sui­vants pré­sentent le nombre d'offres par région et par dépar­te­ment (cli­quez sur les images pour les agran­dir).

Offres par région

Régions
Offres par département

Dépar­te­ments

Comme on pou­vait s'y attendre, l'Île de France concentre à elle seule 40% des offres, dont 22% d'offres uni­que­ment pour Paris intra-muros. Notons qu'une part signi­fi­ca­tive des offres de la SFBI concerne l'étranger (15%), ce qui est assez remar­quable pour une liste de dif­fu­sion essen­tiel­le­ment des­ti­née à un public fran­çais. Enfin on peut iden­ti­fier 2 autres bas­sins d'emploi en bio­in­for­ma­tique en France : Lyon et Mont­pel­lier (qui appa­raissent au tra­vers de leurs régions et dépar­te­ments res­pec­tifs). Au final, les agglo­mé­ra­tions pari­sienne, lyon­naise, et mont­pel­lié­raine concentrent les trois quarts des offres de la SFBI, le reste étant plu­tôt dis­per­sé en France.

Qu'en-est-il des types de contrats, niveaux de diplômes, et durées des postes, si on les observe par région ?

Types de postes par région

Les résul­tats sont déli­cats à inter­pré­ter du fait de la dis­pa­ri­té du nombre total d'offres par région. On peut cepen­dant consta­ter que les postes situés à l'étranger concernent sur­tout des thèses et des CDD (majo­ri­tai­re­ment des post-docs). Les CDI sont inexis­tants de 2 grandes régions : le Centre et la Bour­gogne-Franche-Com­té. On trouve cepen­dant des thèses un peu par­tout sauf en Nor­man­die et Bour­gogne-Franche-Com­té (mais il y a glo­ba­le­ment peu d'offres dans ces régions).

Diplôme requis par régionPour les diplômes requis, l'étranger se dis­tingue là encore énor­mé­ment de la France : la majo­ri­té des offres demande d'avoir un doc­to­rat (85%). En France, on tourne tou­jours plus ou moins autour de 50% (avec quelques varia­tions rare­ment signi­fi­ca­tives du fait du faible échan­tillon­nage des régions du bas du graphe).

Durée des CDD par région
Les barres rouges repré­sentent les médianes.

Pour les durées, les pro­fils dif­fèrent par­fois beau­coup selon les régions, bien que les médianes se situent tou­jours à 12 ou 18 mois lorsqu'on est en France. Par exemple, à quan­ti­té égale de CDD pro­po­sés, la région Lan­gue­doc-Rous­sillon-Midi-Pyré­nées pro­pose beau­coup plus de contrats courts que la région Auvergne-Rhône-Alpes, laquelle pos­sède un pro­fil plus uni­forme, syno­nyme de diver­si­té. L'étranger semble assez varié sur la durée des offres, mais se dis­tingue de la France par une médiane situé à 24 mois (com­prendre qu'au moins la moi­tié des offres sont des contrats longs voire très longs). On y trouve éga­le­ment une bonne par­tie, sinon la plu­part, des offres de 36 mois ou plus. Au final, l'exception fran­çaise s'exprime par la briè­ve­té de ses offres (cer­tains diraient la pré­ca­ri­té de ses offres, mais est-on vrai­ment moins pré­caire pen­dant un post-doc de 4 ans ?). Il est cepen­dant inté­res­sant de voir que le pri­vé semble être un aus­si mau­vais élève que le public de ce coté là.

Conclusion

Avec plus de 5500 abon­nés, la liste de dif­fu­sion de la SFBI est un outil excep­tion­nel pour ana­ly­ser l'état du mar­ché de l'emploi en bio­in­for­ma­tique en France. Cepen­dant, même en se limi­tant aux offres pré­for­ma­tées dis­po­nibles sur le site, nous avons dû réa­li­ser un énorme tra­vail de net­toyage des don­nées. Ana­ly­ser les offres non for­ma­tées semble donc être une tâche autre­ment plus com­plexe, qui per­met­trait cepen­dant de remon­ter beau­coup plus loin dans le temps (et pour­quoi pas, d'analyser l'effet de cer­taines lois sur la durée des contrats de tra­vail par exemple). Notons que ce type d'analyse pour­rait être gran­de­ment amé­lio­ré en contrai­gnant un peu plus les entrées des uti­li­sa­teurs (par exemple, en impo­sant une durée en mois), ou en ajou­tant de nou­velles entrées qui pour­raient être faci­le­ment ana­ly­sées (on pense notam­ment au niveau de rému­né­ra­tion). Ceci est évi­dem­ment un mes­sage caché à des­ti­na­tion des ges­tion­naires du site de la SFBI 🙂 .

Si on extra­pole ces ana­lyses, à quoi res­semble le bio­in­for­ma­ti­cien fran­çais ? Oui, toi qui lis ces lignes, nous te connais­sons main­te­nant. Tu as fait ton stage de M2 sur de l'analyse de don­nées. Tu as signé un CDD de 12 ou 18 mois, peut être même un post-doc si tu as ton doc­to­rat, et de la fenêtre de ton bureau tu peux contem­pler un bout du bas­sin pari­sien. Bio­in­for­ma­ti­cien médian, nous te saluons !

Enfin, une der­nière remarque pour ceux qui en veulent tou­jours plus. L'analyse que nous avons pro­po­sé est plu­tôt sta­tique, elle uti­lise l'ensemble des don­nées alors qu'elles s'étalent sur 4 longues années. J'imagine que beau­coup d'entre vous aime­raient une ana­lyse de l'évolution du mar­ché année après année (notam­ment, au hasard, pour la durée des CDD). Tout ceci, mes amis, fera l'objet d'un second article. Mais n'hésitez pas à suivre et à par­ti­ci­per au dépôt Github pour avoir toutes ces infos en avant-pre­mière.

Un grand mer­ci à Kum­qua­tum, Hed­Jour et Yoann M. pour les amé­lio­ra­tions appor­tées au cours de la relec­ture de cet article.



Pour continuer la lecture :


Commentaires

6 réponses à “État de l'emploi bioinformatique en France : analyse des offres de la SFBI”

  1. Avatar de Anaïs B.
    Anaïs B.

    Bra­vo, super bou­lot !

  2. Avatar de Cécile
    Cécile

    Pour aller plus loin, sur la par­tie nuage de mots il pour­rait etre inter­es­sant de ne pas tenir compte des accents (ingé­nieur /​ inge­nieur) et de ne pas tenir compte de la langue (data /​ don­nées).
    Mer­ci, bon bou­lo !
    Cecile

  3. Mer­ci pour cet excellent article ! 🙂

    J'attends la suite avec impa­tience.

  4. Avatar de Fouzia Moussouni-Marzolf
    Fouzia Moussouni-Marzolf

    Mer­ci pour ce billet remar­qua­ble­ment ins­truc­tif.
    La cen­tra­li­té de Paris y est bien confir­mée ain­si que la pré­do­mi­nance des CDDs courts. ça en dit beau­coup et ça va de soit avec les reven­di­ca­tions actuelles des jeunes tra­vailleurs.
    La cerise sur le gâteau serait de com­plé­ter cette étude par le nombre de CDDs cumu­lés ain­si que l'age des can­di­dats avant de décro­cher un CDI (et tout ça au cours du temps — i.e l'écart entre avant et aujourd'hui ou avant et après la crise (2007)) ? pour les déten­teurs d'un Mas­ter d'une part et ceux d'un PhD d'autre part.
    Je peux contri­buer par mes propres infos (thèse obte­nue en 19997 — oui, je suis une vieille et jus­te­ment j'en ai vu !).
    Il fau­dra d'autres types de don­nées bien sûr, mais ça met­tra une lumière énorme sur beau­coup de choses.

  5. Avatar de Jean-Claude Chèvre
    Jean-Claude Chèvre

    Serait il pos­sible d'extraire de cette ana­lyse les com­pé­tences bio­in­for­ma­tiques les plus deman­dées (eg. lan­gages, stat. … ) ?

    Mer­ci

    Cor­dia­le­ment

    1. Bon­jour,
      Ce serait pos­sible. On va essayer de tendre vers ça.
      Le pro­blème est que le conte­nu des annonces n'est pas dif­fu­sable pour le moment, la SFBI n'ayant pas don­né son accord. Si un jour le conte­nu est dis­po­nible, d'autres per­sonnes pour­ront se pen­cher sur ce genre d'analyse (puisque c'est open source) et pro­duire des résul­tats plus per­ti­nents que je ne le ferais.
      Bref, ça serait cool mais c'est pas pour tout de suite :/​

Laisser un commentaire