Bioinformatique :
Enquête Bioinfo-fr 2018 : un portrait de la bioinfo

Après 1 mois et demi d'enquête et 1 mois et demi d'attente, voici donc l'article tant promis qui va décortiquer vos réponses!  Nous tenons par ailleurs à remercier tout les répondants qui ont donné de leur temps et qui auront partagé ce sondage dans leur entourage. Merci d'avoir contribué à cette enquête. 🙂

L'intégralité des données a été traitée via R dont les scripts sont disponibles sur le GitHub du blog. Les données sont quant à elles disponibles par demande à notre mail habituel.

 

1. Quelques statistiques descriptives

Comme nous vous l'annoncions dans notre édito précédent, nous avons obtenu 417 réponses pour notre enquête. Cependant, qui dit enquête dit quelques petits saboteurs, et qui dit champs ouverts dit quelques petites surprises dans les champs. Nous avons donc éliminé certaines réponses afin de préserver la cohérence de l'enquête (je dédierai notamment un article à ce filtrage ainsi que, plus généralement, les méthodes de pré-traitement de données massives avant analyse). En attendant, voici donc 399 réponses avec lesquelles travailler.

Commençons par le plus facile à traiter, les réponses fermées.

1.1. Généralités

 

Analysons point par point ces graphiques:

  • Le genre: Comme on aurait pu s'en douter, les hommes sont la catégorie la plus représentée. Cependant, contrairement au gouffre qui existe en informatique avec ~97% d'hommes contre ~3% de femmes et ~1% d'autres (non-binaires, queer, ou genre atypique, source : enquête stackoverflow 2018), on est bien plus proche de l'égalité en bioinformatique avec 59% d'hommes, 40% de femmes et 1% d'autres.
  • L'âge: La distribution des âges tend vers la trentaine. Cela peut s'expliquer en partie par la "jeunesse" de la discipline qui n'a vu apparaître ses formation spécifiques qu'il y a moins de 20 ans. Ou encore que notre lectorat est un public plutôt jeune 🙂
  • La discipline dominante: les bioinformaticiens sont majoritairement équilibrés! 😉 Notre discipline demandant de savoir travailler sur les deux domaine à la fois, il n'est pas étonnant d'obtenir ce résultat.
  • La localisation: Étant donné que notre sondage a principalement été diffusé via les lecteurs de notre blog ainsi que la liste de la SFBI (qui tous deux touchent une population majoritairement française), il était normal de s'attendre à ce que plus des 3/4 des répondant soient en France.
  • Le type d'emploi: Le public engage plus, c'est un fait. Cela concorde avec la proportion d'offres d'emploi que vous pouvez voir passer chaque jour sur la liste d'emploi bioinfo. Notons toutefois que les moyens de diffusion de cette enquête ont pu biaiser les résultats en faveur du secteur public.
  • Le type de contrat: Le CDD, cette valeur dominante. On retrouvait déjà cette tendance lors de l'étude des offres de la liste bioinfo, réalisée il y a un peu plus de 2 ans. Cependant, la différence de proportion est inférieure et le CDI n'est vraiment pas loin.
  • Le salaire: Si le salaire moyen est tiré vers le haut par quelques exceptions, le salaire médian est quant à lui entre 30 et 35 000 euros brut par an.
  • Le diplôme: La bioinformatique est un domaine où le niveau d'étude minimal est élevé. Ainsi même si on trouve des formation de niveau Bac +2/+3, le nombre de personnes embauchées à ce niveau sont minoritaires. Les Bac+5 sont quant à eux ceux qui sont les plus représentés ici. Comptant pour pratiquement 1/3 des réponses, les Bac+8 sont finalement moins présents que les précédents.
  • Le système d'exploitation: GNU/Linux est de loin majoritaire. On constate tout de même que l'utilisation de macOS arrive à la même hauteur que celle de Windows associé à une machine virtuelle Linux.
  • Le contexte d'utilisation des langages de programmation: Le bioinformaticien scripte et c'est visiblement une bonne situation puisque c'est la première utilisation citée. Proche derrière, l'analyse statistique qui lui est fortement lié affiche pratiquement le même score. Le développement d'applications est pour le coup bien plus en retrait.

 

1.2. Langages

Note : l'analyse des réponses ouvertes a nécessité un traitement syntaxique et sémantique (à retrouver, comme dit plus haut, dans un prochain article) afin d'obtenir des catégories uniques tel que précédemment.

 

Parmi tous les langages cités comme utilisés par nos répondant, python tire la vedette. R et bash le suivent, pratiquement à égalité. Cette information confirme la tendance des langages utilisés pour la création d'outils, la réalisation d'analyse en bioinformatique. Le reste des langages quant à eux ne dépasse pas plus de 7.5% d'utilisation. La catégorie "autre" regroupe l'ensemble des langages répondus ne comptabilisant pas plus d'une citation dans les réponses (ex : fortran, vba).

À la vue des catégories récupérées, on peut toutefois noter une certaine confusion/abus de langage de la part des répondants. Notre question était "Quel(s) langages de programmation utilisez-vous quotidiennement", mais on retrouve en réponse des SGBD (mysql, postgresql), shell (confondu probablement avec bash) donc une interface, des commandes bash (sed, awk), des frameworks (asp, jquery), voir même des contexte applicatif de langage (programming, web).

1.3. Postes occupés

Contrairement aux intitulés de langages, les données de titre de poste comportaient bien plus de bruit, comme vous pouvez vous en douter. On s'est donc limité pour cette étude à un nuage de mots, cependant rassurez-vous, on reviendra sur ces données prochainement. Vous retrouverez donc dans ce nuage de mots de nombreux mots à la même sémantique mais à la syntaxe différente pour cause d'anglicisme, d'accord avec le genre ou le nombre, d'abréviations, etc.

Ce sont 123 intitulés de postes qui ont ainsi comporté le mot "ingénieur", représentant un peu plus de 30% des entrées. Les mots "bioinformatique" et "bioinformaticien" représentent un peu moins de 20% des réponses chacun (même si, dans le cas de ce dernier, le nombre est en réalité plus élevé pour les raisons évoquées plus haut, ex: "bioinformaticienne"). Autour d'eux gravitent plusieurs termes qui tantôt désignent d'autres types de postes (doctorant, stagiaire, directeur, ...) et tantôt des spécificités de domaine (microbiologie, développement, ...)

 

2. Analyses comparatives

Après ces préliminaires nécessaires, passons à la mise en contraste de nos données.

2.1. Public ou privé, l'éternelle division

Comme indiqué en première partie, le public domine les réponses. Quel est son profil et en quoi diffère-t-il de celui du privé ou des autres ?

 

  • Le détail de la répartition des genres n'a pas permis d'observer de différence sous le spectre de la différence privé/public.
  • A l'inverse, on observe une dynamique différente pour la pyramide des age : la tranche des 31-35 ans semble délaissée par le privé, cassant le début de la gaussienne qui se dessine.
  • Le type de contrat témoigne de la conjoncture concernant les doctorat et les CDD: si les thèses avec le privé (tel que les CIFRES) existent, elles ne sont pas légion, et le public se repose pour beaucoup sur des CDD plutôt que les CDI. Néanmoins, le public semble au total comporter plus de personnes en CDI que le privé.
  • Le master reste, quant à lui, le niveau de diplôme préféré toutes catégories confondues

2.2. Hommes/femmes/autres en bioinfo

La bioinformatique semblait, d'après les premiers résultats, être moins impactée dans la répartition homme/femme que d'autres domaine. Elle reste cependant tout aussi déséquilibrée face aux personnes ne se définissant pas selon ces genres.


D'après ces graphiques, le genre ne semble avoir que peu d'influence sur l'âge, le contrat et le niveau de diplôme des bioinformaticiennes et bioinformaticiens.

2.3. Le salaire sous toutes ses formes

 

 

 

  • On observe une transition progressive du type de contrat à mesure que le salaire augmente: stagiaire < CDD < CDI. Le salaire médian varie pour chacun : 0-15K € pour les stagiaires, 20-25K € pour les CDD, et 35-40K € pour les CDI.
  • De la même manière, le niveau de formation voit une transition avec l'augmentation du salaire : licence < master/DEA/DESS < doctorat. Le nombre de diplômés BTS/DUT/DEUG est quant à lui trop faible pour permettre de confirmer/infirmer cette tendance. Le salaire médian se situe ainsi dans la tranche 25-30K € pour les masters/DEA/DESS, et 35-40K € pour les doctorats.
  • Le salaire médian en France se situe dans la tranche 25-30K €. Malheureusement, le nombre de répondant pour les personnes travaillant hors France (Europe ou non) devient trop réduit une fois réparti sur les tranches de salaire pour être utilisable.
  • Le privé tend à avoir un salaire plus élevé que le public: le salaire médian du premier est de 30-35K € tandis que celui du second est plutôt de 25-30K €
  • Les personnes ayant considéré avoir une dominance dans l'informatique pour leur travail gagnent plus, 30-35K €, que les autres, 25-30K €
  • Le salaire tend à augmenter avec l'age, mais comme on peut s'en douter, et comme le confirme le graphique sur l'expérience professionnelle, c'est surtout une histoire d'années d'ancienneté. On peut noter que jusqu'à la tranche 50-55K €, la distribution constitue une gaussienne et qu'au delà les résultat sont bien plus imprévisibles.

 

3. Pour conclure

Par notre enquête et l'étude de ses 399 réponses, nous avons tenté d'esquisser le portrait de la bioinformatique... pour finalement vous dire qu'elle est loin d'être un portrait unique ! À travers ces quelques graphiques, nous avons pu ainsi confirmer ou infirmer certaines hypothèses basées sur l'expérience personnelle (ex: le recrutement plus fort de Bac+5 que de Bac+8)

Des analyses plus poussées sont encore possibles, notamment avec un travail sur les données en champ libre. C'est pourquoi nous nous attaquerons plus en détail à ce soucis dans un prochain article. Entre temps, si jamais d'autres idées d'analyse sur ces données vous viennent, n'hésitez pas à prendre contact avec nous à l'adresse habituelle!

Nous tenons encore une fois remercier les personnes qui ont répondu à notre enquête et qui l'ont partagée dans leur entourage professionnel. Nous espérons que cet article vous aura plus et, qui sait... pourquoi ne pas relancer l'enquête d'ici quelques années? 😉

 

Merci aux relecteurs Guillaume Devailly, Nisaea, et Yoann M. pour leurs remarques et avis constructifs.

 

  • À propos de
  • Doctorante rousse à vocation bioinformatique / biostatistiques, je suis admin de bioinfo-fr depuis 2017, et ex-trésorière de JeBiF. Après un parcours assez inhabituel (BTS Bio, Licence Stats/Info, Master BIBS de l'U. Paris Sud/Polytechnique), je suis actuellement en doctorat au CHUL de Québec/U. Laval au Canada où je travaille dans le cadre de ma thèse sur les réseaux de co-expression appliqués au vieillissement de la peau.

7 commentaires sur “Enquête Bioinfo-fr 2018 : un portrait de la bioinfo

  1. Je m\'insurge ! ;D
    Awk est un langage de programmation, et sed peut lui aussi être considéré comme langage de programmation car il permet d\'écrire des instructions complexes.
    En revanche, Latex n\'est pas un langage de programmation mais un langage de composition de texte.
    De plus, \"shell\" est le terme générale pour appeler l’interpréteur de commande UNIX, et ça peut être sh, bash, ksh, zsh, etc...

    En tout cas, beau travail !

    • T\'avais tout le temps de t\'insurger avant la publication :p

      Plus sérieusement, oui awk est un langage de programmation, c\'est une erreur de ma part. Par contre je maintiens que sed ne rentre pas dans cette catégorie au sens où il n\'est qu\'un parseur/transformateur de données en flux (même s\'il est très performant pour cela). Pour LaTeX, je ne l\'ai pas cité explicitement comme non langage car je n\'ai pas été exhaustive dans la liste des non-langages 🙂
      Concernant shell, c\'est un abus de langage à mon sens car il désigne l\'interface en premier lieu.

      Merci pour le compliment, et toujours prête à discuter de la \"légitimité\" du nom de \"langage de programmation\" 😉

  2. très focalisé sexe, age, argent, diplôme... Je serais curieux savoir aussi sur quoi les bioinformaticiens français travaillent et s\'ils aiment ce qu\'ils font.

    • C\'est effectivement focalisé sur ces critères car ils étaient ceux interrogés via notre enquête. Nous ne pouvions pas extrapoler les informations que vous nous demandez à partir de ce sondage.
      Cependant nous gardons l\'idée en tête pour un éventuel prochain sondage, merci pour votre suggestion.

  3. Ce serait aussi intéressant de voir la taille des équipes bioinfo en fonction de l\'établissement (public / privé)
    On pourrait imaginer aussi faire une distinction sur le public car un bioinfo de recherche et un bioinfo hospitalier ce n\'est pas la même chose.
    On pourrait aussi voir les thématiques sur quoi travaille les bioinfo (écologie, plante, médical, pharmaceutique, fondamental, ...)

    Enfin \" le recrutement plus fort de Bac+5 que de Bac+8\" est-ce pas tout simplement du au faible nombre de thèse bioinfo (par rapport au nombre de master) ?

  4. Bonjour,

    Est-il possible d\'accéder aux données ?

    • Bonjour Yannick,

      Ecrivez-nous un mail sur admin]AT[bioinfo-frPOINTnet et on se fera un plaisir de vous faire suivre cela.

Laisser un commentaire