Enquête Bioinfo-fr 2018 : un portrait de la bioinformatique

Après 1 mois et demi d'enquête et 1 mois et demi d'attente, voi­ci donc l'article tant pro­mis qui va décor­ti­quer vos réponses !  Nous tenons par ailleurs à remer­cier tout les répon­dants qui ont don­né de leur temps et qui auront par­ta­gé ce son­dage dans leur entou­rage. Mer­ci d'avoir contri­bué à cette enquête. 🙂

L'intégralité des don­nées a été trai­tée via R dont les scripts sont dis­po­nibles sur le GitHub du blog. Les don­nées sont quant à elles dis­po­nibles par demande à notre mail habi­tuel.

1. Quelques statistiques descriptives

Comme nous vous l'annoncions dans notre édi­to pré­cé­dent, nous avons obte­nu 417 réponses pour notre enquête. Cepen­dant, qui dit enquête dit quelques petits sabo­teurs, et qui dit champs ouverts dit quelques petites sur­prises dans les champs. Nous avons donc éli­mi­né cer­taines réponses afin de pré­ser­ver la cohé­rence de l'enquête (je dédie­rai notam­ment un article à ce fil­trage ain­si que, plus géné­ra­le­ment, les méthodes de pré-trai­te­ment de don­nées mas­sives avant ana­lyse). En atten­dant, voi­ci donc 399 réponses avec les­quelles tra­vailler.

Com­men­çons par le plus facile à trai­ter, les réponses fer­mées.

1.1. Généralités

Ana­ly­sons point par point ces gra­phiques :

  • Le genre : Comme on aurait pu s'en dou­ter, les hommes sont la caté­go­rie la plus repré­sen­tée. Cepen­dant, contrai­re­ment au gouffre qui existe en infor­ma­tique avec ~97% d'hommes contre ~3% de femmes et ~1% d'autres (non-binaires, queer, ou genre aty­pique, source : enquête sta­cko­ver­flow 2018), on est bien plus proche de l'égalité en bio­in­for­ma­tique avec 59% d'hommes, 40% de femmes et 1% d'autres.
  • L'âge : La dis­tri­bu­tion des âges tend vers la tren­taine. Cela peut s'expliquer en par­tie par la "jeu­nesse" de la dis­ci­pline qui n'a vu appa­raître ses for­ma­tion spé­ci­fiques qu'il y a moins de 20 ans. Ou encore que notre lec­to­rat est un public plu­tôt jeune 🙂
  • La dis­ci­pline domi­nante : les bio­in­for­ma­ti­ciens sont majo­ri­tai­re­ment équi­li­brés ! 😉 Notre dis­ci­pline deman­dant de savoir tra­vailler sur les deux domaine à la fois, il n'est pas éton­nant d'obtenir ce résul­tat.
  • La loca­li­sa­tion : Étant don­né que notre son­dage a prin­ci­pa­le­ment été dif­fu­sé via les lec­teurs de notre blog ain­si que la liste de la SFBI (qui tous deux touchent une popu­la­tion majo­ri­tai­re­ment fran­çaise), il était nor­mal de s'attendre à ce que plus des 3/​4 des répon­dant soient en France.
  • Le type d'emploi : Le public engage plus, c'est un fait. Cela concorde avec la pro­por­tion d'offres d'emploi que vous pou­vez voir pas­ser chaque jour sur la liste d'emploi bioin­fo. Notons tou­te­fois que les moyens de dif­fu­sion de cette enquête ont pu biai­ser les résul­tats en faveur du sec­teur public.
  • Le type de contrat : Le CDD, cette valeur domi­nante. On retrou­vait déjà cette ten­dance lors de l'étude des offres de la liste bioin­fo, réa­li­sée il y a un peu plus de 2 ans. Cepen­dant, la dif­fé­rence de pro­por­tion est infé­rieure et le CDI n'est vrai­ment pas loin.
  • Le salaire : Si le salaire moyen est tiré vers le haut par quelques excep­tions, le salaire médian est quant à lui entre 30 et 35 000 euros brut par an.
  • Le diplôme : La bio­in­for­ma­tique est un domaine où le niveau d'étude mini­mal est éle­vé. Ain­si même si on trouve des for­ma­tion de niveau Bac +2/+3, le nombre de per­sonnes embau­chées à ce niveau sont mino­ri­taires. Les Bac+5 sont quant à eux ceux qui sont les plus repré­sen­tés ici. Comp­tant pour pra­ti­que­ment 1/​3 des réponses, les Bac+8 sont fina­le­ment moins pré­sents que les pré­cé­dents.
  • Le sys­tème d'exploitation : GNU/​Linux est de loin majo­ri­taire. On constate tout de même que l'utilisation de macOS arrive à la même hau­teur que celle de Win­dows asso­cié à une machine vir­tuelle GNU/​Linux.
  • Le contexte d'utilisation des lan­gages de pro­gram­ma­tion : Le bio­in­for­ma­ti­cien scripte et c'est visi­ble­ment une bonne situa­tion puisque c'est la pre­mière uti­li­sa­tion citée. Proche der­rière, l'analyse sta­tis­tique qui lui est for­te­ment lié affiche pra­ti­que­ment le même score. Le déve­lop­pe­ment d'applications est pour le coup bien plus en retrait.

1.2. Langages

Note : l'analyse des réponses ouvertes a néces­si­té un trai­te­ment syn­taxique et séman­tique (à retrou­ver, comme dit plus haut, dans un pro­chain article) afin d'obtenir des caté­go­ries uniques tel que pré­cé­dem­ment.

Par­mi tous les lan­gages cités comme uti­li­sés par nos répon­dant, python tire la vedette. R et bash le suivent, pra­ti­que­ment à éga­li­té. Cette infor­ma­tion confirme la ten­dance des lan­gages uti­li­sés pour la créa­tion d'outils, la réa­li­sa­tion d'analyse en bio­in­for­ma­tique. Le reste des lan­gages quant à eux ne dépasse pas plus de 7.5% d'utilisation. La caté­go­rie "autre" regroupe l'ensemble des lan­gages répon­dus ne comp­ta­bi­li­sant pas plus d'une cita­tion dans les réponses (ex : for­tran, vba).

À la vue des caté­go­ries récu­pé­rées, on peut tou­te­fois noter une cer­taine confusion/​abus de lan­gage de la part des répon­dants. Notre ques­tion était "Quel(s) lan­gages de pro­gram­ma­tion uti­li­sez-vous quo­ti­dien­ne­ment", mais on retrouve en réponse des SGBD (mys­ql, post­gres­ql), shell (confon­du pro­ba­ble­ment avec bash) donc une inter­face, des com­mandes bash (sed, awk), des fra­me­works (asp, jque­ry), voir même des contexte appli­ca­tif de lan­gage (pro­gram­ming, web).

1.3. Postes occupés

Contrai­re­ment aux inti­tu­lés de lan­gages, les don­nées de titre de poste com­por­taient bien plus de bruit, comme vous pou­vez vous en dou­ter. On s'est donc limi­té pour cette étude à un nuage de mots, cepen­dant ras­su­rez-vous, on revien­dra sur ces don­nées pro­chai­ne­ment. Vous retrou­ve­rez donc dans ce nuage de mots de nom­breux mots à la même séman­tique mais à la syn­taxe dif­fé­rente pour cause d'anglicisme, d'accord avec le genre ou le nombre, d'abréviations, etc.

Ce sont 123 inti­tu­lés de postes qui ont ain­si com­por­té le mot "ingé­nieur", repré­sen­tant un peu plus de 30% des entrées. Les mots "bio­in­for­ma­tique" et "bio­in­for­ma­ti­cien" repré­sentent un peu moins de 20% des réponses cha­cun (même si, dans le cas de ce der­nier, le nombre est en réa­li­té plus éle­vé pour les rai­sons évo­quées plus haut, ex : "bio­in­for­ma­ti­cienne"). Autour d'eux gra­vitent plu­sieurs termes qui tan­tôt dési­gnent d'autres types de postes (doc­to­rant, sta­giaire, direc­teur, …) et tan­tôt des spé­ci­fi­ci­tés de domaine (micro­bio­lo­gie, déve­lop­pe­ment, …)

2. Analyses comparatives

Après ces pré­li­mi­naires néces­saires, pas­sons à la mise en contraste de nos don­nées.

2.1. Public ou privé, l'éternelle division

Comme indi­qué en pre­mière par­tie, le public domine les réponses. Quel est son pro­fil et en quoi dif­fère-t-il de celui du pri­vé ou des autres ?

  • Le détail de la répar­ti­tion des genres n'a pas per­mis d'observer de dif­fé­rence sous le spectre de la dif­fé­rence privé/​public.
  • A l'inverse, on observe une dyna­mique dif­fé­rente pour la pyra­mide des age : la tranche des 31–35 ans semble délais­sée par le pri­vé, cas­sant le début de la gaus­sienne qui se des­sine.
  • Le type de contrat témoigne de la conjonc­ture concer­nant les doc­to­rat et les CDD : si les thèses avec le pri­vé (tel que les CIFRES) existent, elles ne sont pas légion, et le public se repose pour beau­coup sur des CDD plu­tôt que les CDI. Néan­moins, le public semble au total com­por­ter plus de per­sonnes en CDI que le pri­vé.
  • Le mas­ter reste, quant à lui, le niveau de diplôme pré­fé­ré toutes caté­go­ries confon­dues

2.2. Hommes/​femmes/​autres en bioinfo

La bio­in­for­ma­tique sem­blait, d'après les pre­miers résul­tats, être moins impac­tée dans la répar­ti­tion homme/​femme que d'autres domaine. Elle reste cepen­dant tout aus­si dés­équi­li­brée face aux per­sonnes ne se défi­nis­sant pas selon ces genres.


D'après ces gra­phiques, le genre ne semble avoir que peu d'influence sur l'âge, le contrat et le niveau de diplôme des bio­in­for­ma­ti­ciennes et bio­in­for­ma­ti­ciens.

2.3. Combien gagne un bioinformaticien ?

La ques­tion du salaire en bio-infor­ma­tique est sou­vent posée sur les moteurs de recherche. Voi­ci quelques élé­ments de réponses :

  • On observe une tran­si­tion pro­gres­sive du type de contrat à mesure que le salaire aug­mente : sta­giaire < CDD < CDI. Le salaire médian varie pour cha­cun : 0–15K € pour les sta­giaires, 20–25K € pour les CDD, et 35–40K € pour les CDI.
  • De la même manière, le niveau de for­ma­tion voit une tran­si­tion avec l'augmentation du salaire : licence < master/​DEA/​DESS < doc­to­rat. Le nombre de diplô­més BTS/​DUT/​DEUG est quant à lui trop faible pour per­mettre de confirmer/​infirmer cette ten­dance. Le salaire médian se situe ain­si dans la tranche 25–30K € pour les masters/​DEA/​DESS, et 35–40K € pour les doc­to­rats.
  • Le salaire médian en France se situe dans la tranche 25–30K €. Mal­heu­reu­se­ment, le nombre de répon­dant pour les per­sonnes tra­vaillant hors France (Europe ou non) devient trop réduit une fois répar­ti sur les tranches de salaire pour être uti­li­sable.
  • Le pri­vé tend à avoir un salaire plus éle­vé que le public : le salaire médian du pre­mier est de 30–35K € tan­dis que celui du second est plu­tôt de 25–30K €
  • Les per­sonnes ayant consi­dé­ré avoir une domi­nance dans l'informatique pour leur tra­vail gagnent plus, 30–35K €, que les autres, 25–30K €
  • Le salaire tend à aug­men­ter avec l'age, mais comme on peut s'en dou­ter, et comme le confirme le gra­phique sur l'expérience pro­fes­sion­nelle, c'est sur­tout une his­toire d'années d'ancienneté. On peut noter que jusqu'à la tranche 50–55K €, la dis­tri­bu­tion consti­tue une gaus­sienne et qu'au delà les résul­tat sont bien plus impré­vi­sibles.

3. Pour conclure

Par notre enquête et l'étude de ses 399 réponses, nous avons ten­té d'esquisser le por­trait de la bio­in­for­ma­tique… pour fina­le­ment vous dire qu'elle est loin d'être un por­trait unique ! À tra­vers ces quelques gra­phiques, nous avons pu ain­si confir­mer ou infir­mer cer­taines hypo­thèses basées sur l'expérience per­son­nelle (ex : le recru­te­ment plus fort de Bac+5 que de Bac+8)

Des ana­lyses plus pous­sées sont encore pos­sibles, notam­ment avec un tra­vail sur les don­nées en champ libre. C'est pour­quoi nous nous atta­que­rons plus en détail à ce sou­cis dans un pro­chain article. Entre temps, si jamais d'autres idées d'analyse sur ces don­nées vous viennent, n'hésitez pas à prendre contact avec nous à l'adresse habi­tuelle !

Nous tenons encore une fois remer­cier les per­sonnes qui ont répon­du à notre enquête et qui l'ont par­ta­gée dans leur entou­rage pro­fes­sion­nel. Nous espé­rons que cet article vous aura plus et, qui sait… pour­quoi ne pas relan­cer l'enquête d'ici quelques années ? 😉

Mer­ci aux relec­teurs Guillaume Devailly, Nisaea, et Yoann M. pour leurs remarques et avis construc­tifs.



Pour continuer la lecture :


Commentaires

10 réponses à “Enquête Bioinfo-fr 2018 : un portrait de la bioinformatique”

  1. Je m'insurge ! ;D
    Awk est un lan­gage de pro­gram­ma­tion, et sed peut lui aus­si être consi­dé­ré comme lan­gage de pro­gram­ma­tion car il per­met d'écrire des ins­truc­tions com­plexes.
    En revanche, Latex n'est pas un lan­gage de pro­gram­ma­tion mais un lan­gage de com­po­si­tion de texte.
    De plus, "shell" est le terme géné­rale pour appe­ler l’interpréteur de com­mande UNIX, et ça peut être sh, bash, ksh, zsh, etc…

    En tout cas, beau tra­vail !

    1. T'avais tout le temps de t'insurger avant la publi­ca­tion :p

      Plus sérieu­se­ment, oui awk est un lan­gage de pro­gram­ma­tion, c'est une erreur de ma part. Par contre je main­tiens que sed ne rentre pas dans cette caté­go­rie au sens où il n'est qu'un parseur/​transformateur de don­nées en flux (même s'il est très per­for­mant pour cela). Pour LaTeX, je ne l'ai pas cité expli­ci­te­ment comme non lan­gage car je n'ai pas été exhaus­tive dans la liste des non-lan­gages 🙂
      Concer­nant shell, c'est un abus de lan­gage à mon sens car il désigne l'interface en pre­mier lieu.

      Mer­ci pour le com­pli­ment, et tou­jours prête à dis­cu­ter de la "légi­ti­mi­té" du nom de "lan­gage de pro­gram­ma­tion" 😉

  2. très foca­li­sé sexe, age, argent, diplôme… Je serais curieux savoir aus­si sur quoi les bio­in­for­ma­ti­ciens fran­çais tra­vaillent et s'ils aiment ce qu'ils font.

    1. C'est effec­ti­ve­ment foca­li­sé sur ces cri­tères car ils étaient ceux inter­ro­gés via notre enquête. Nous ne pou­vions pas extra­po­ler les infor­ma­tions que vous nous deman­dez à par­tir de ce son­dage.
      Cepen­dant nous gar­dons l'idée en tête pour un éven­tuel pro­chain son­dage, mer­ci pour votre sug­ges­tion.

  3. Ce serait aus­si inté­res­sant de voir la taille des équipes bioin­fo en fonc­tion de l'établissement (public /​ pri­vé)
    On pour­rait ima­gi­ner aus­si faire une dis­tinc­tion sur le public car un bioin­fo de recherche et un bioin­fo hos­pi­ta­lier ce n'est pas la même chose.
    On pour­rait aus­si voir les thé­ma­tiques sur quoi tra­vaille les bioin­fo (éco­lo­gie, plante, médi­cal, phar­ma­ceu­tique, fon­da­men­tal, …)

    Enfin " le recru­te­ment plus fort de Bac+5 que de Bac+8" est-ce pas tout sim­ple­ment du au faible nombre de thèse bioin­fo (par rap­port au nombre de mas­ter) ?

  4. Avatar de Yannick

    Bon­jour,

    Est-il pos­sible d'accéder aux don­nées ?

    1. Avatar de Yoann M.

      Bon­jour Yan­nick,

      Ecri­vez-nous un mail sur admin]AT[bioinfo-frPOINTnet et on se fera un plai­sir de vous faire suivre cela.

  5. Avatar de Nesrine Mandhouj
    Nesrine Mandhouj

    Bon­jour, quel evo­lu­tion de car­riere est pos­sible pour un bio-infor­ma­ti­cien svp ? Mer­ci

  6. Avatar de CHUSSEAU

    Bon­jour, je suis actuel­le­ment en deuxième année de licence de bio­lo­gie et j’aimerais plus tard m’orienter vers la bio-infor­ma­tique. Dans le cadre de mes études j’aurais aimé uti­li­ser votre image avec plu­sieurs gra­phiques. Je vou­lais tout d’abord vous deman­der l’autorisation.
    Cor­dia­le­ment.
    Mer­ci de votre com­pré­hen­sion.

    1. Avatar de Yoann M.

      Bon­jour,
      Mer­ci pour votre com­men­taire.
      Comme men­tion­né dans le foo­ter de la page ("Sauf men­tion contraire, tous les conte­nus sont publiés sous licence CC-by-SA 2.0 et supé­rieure."), vous avez le droit de vous ser­vir et ce sans même nous deman­der l'autorisation du moment que vous citer la source.
      Le par­tage est un des buts pre­miers de notre site 🙂
      C'est tout à votre hon­neur de deman­der la per­mis­sion quand même et nous vous en remer­cions !
      Bon cou­rage pour la suite de vos études !

Laisser un commentaire