Questions à… Marie Beurton Aimar

4 mai 2017

-

par

Retrouvez ici la retranscription de la première Table Ouverte en BIonformatique (TOBi) organisée à Lyon le 16 mars 2017

Clément DELESTRE (CD) : Merci d'être présente pour ce premier TOBi à Lyon, est-ce que tu peux nous présenter ta formation, ton parcours, etc ?

Marie Beurton-Aimar (MBA) : On va rire là… Alors moi je suis informaticienne, un peu atypique parce que je suis allée à l'université tard, j'ai fait ma thèse tard ; j'ai passé ma thèse en 2000 donc il n'y a pas très longtemps, même si pour vous ça parait peut-être loin… J'ai même travaillé dans le privé avant. J'ai décidé de passer côté recherche et mon sujet de thèse portait sur l'aide à la décision médicale.

Ma spécialité c'est le génie logiciel : modélisation objet etc. [NDLR : MBA s'adresse à l'audience présente lors de l’événement] Ceux qui sont en master vous allez découvrir que pour avoir des bourses de thèse il faut remplir des tonnes de critères que personnellement je n'avais aucune chance de remplir, par conséquent j'étais ingénieur système dans le labo pour financer ma thèse. J'étais dans une équipe de biostats, donc je faisais des analyses d'épidémiologie génétique pour eux.

C'était du hasard, eux codaient en Fortran, ils étaient chercheurs de formation, en maths appliquées. C'était très intéressant, on travaillait sur le lupus avec des vraies données qui arrivaient de Suède et on devait analyser les allèles, on avait également des données sur le génotype et le phénotype. L'équipe voulait savoir s'il y avait des liaisons entre les allèles et le phénotype et donc ils sont venus me voir en disant "En dehors de nous installer G++, LaTeX etc. est-ce que tu pourrais nous coder un parcours d'arbre familial ? - Oui ça devrait être possible !" J'ai commencé la bioinfo comme ça !

Puis quand j'ai cherché un poste de Maître de Conférences, il y en avait un en modélisation cellulaire sur la mitochondrie à l'échelle du métabolisme. Le profil était bioinfo pour aider à la modélisation mathématique. Le responsable d'équipe avait une vision classique : Équation différentielle, Michaelis-Menten etc. Le problème c'est que les vitesses sont loin d'être toutes connues et celles qui le sont, sont dans des conditions expérimentales parfois incompatibles pour reconstruire un réseau… Donc on a basculé assez vite sur la modélisation de réseaux métaboliques avec un outil qui à l'époque était un petit peu exotique et qui maintenant commence à se répandre : les modes élémentaires.

Réseau métabolique représenté comme une carte de métro (source : Chakazul, CC-BY-SA)

Ça consiste en de l'analyse de graphes. En fait, il s'agit de chercher les chemins uniques et minimaux dans le graphe métabolique qui respectent l'état stable. C'est une méthode plutôt sympa sauf que ça produit des centaines, voir des milliers de réponses, ce qui pose beaucoup de problèmes pour l'étape d'analyse du côté des biologistes. Notre objectif était donc de faire des outils qui permettaient d’interroger ces solutions, puis les analyser automatiquement parce que ce n'est pas possible à la main (ou très douloureux).

Ça c'est une partie de mon activité, que l'on a continuée avec les minimal cut set. Ce sont en quelque sorte la suite des modes élémentaires. Le calcul de ces derniers est également une opération sur un graphe, comme pour les modes élémentaires, mais c'est une analyse de réseau statique ; c'est-à-dire que l'on oublie les vitesses. C'est le calcul dual des modes élémentaires, au lieu de chercher les chemins réalisables dans le graphe (du réseau métabolique) on cherche les réactions qui, si elles sont inactivées, coupent le flux dans le réseau.

Une autre partie de mon activité est la simulation avec des systèmes multi-agents ; modèle individu centré, modèle proie-prédateur. Les modèles proie-prédateur sont très connus en théorie probabiliste, mais il y a une version "informatique" qui s'appelle les systèmes multi-agents et qui travaille sur un modèle un peu différent. On est entre autres capable de prendre en compte un environnement 3D.

Dans ce domaine on a réalisé la modélisation de complexes enzymatiques. Plus précisément un couplage entre la structure de la dynamique moléculaire et l'échelle métabolique. On cherche à être capable de faire bouger la structure suivant les lois de la dynamique moléculaire et en même temps atteindre les échelles de temps qui étaient suffisantes pour coder les réactions. On travaille sur des réactions red/ox, dans le complexe 3 de la chaîne respiratoire.

Sinon on fait d'autres choses dans notre équipe avec les systèmes multi-agents comme de la segmentation d'image (j'ai aussi une activité en traitement d'images). On fait de la segmentation d'image avec des systèmes multi-agents, basée sur les araignées sociales ou sur les fourmis. On a traité des IRM de cerveaux il y a quelques années et maintenant on fait de la morphométrie sur des images 2D pour essayer de faire de l'estimation automatique de landmark sur des images biologiques. Cette activité est en collaboration avec l'INRA de Rennes, avec des gens qui travaillent en écologie, sur la préservation des cultures, par exemple, et qui analysent les populations d'insectes (ou de carabes … qui ne sont pas des insectes !). Les nouvelles études devraient aussi porter sur les taches de maladie sur des tiges ou sur des feuilles… Pour ces travaux on utilise plutôt des méthodes classiques de traitement d'images que des systèmes multi-agents.

Capture écran imageJ — Capture d'écran d'ImageJ (source : wikimedia, domaine public)

Actuellement, il y a du matériel d'acquisition d'images en biologie avec des capacités et des performances hallucinantes et il y a très peu d'outils pour les analyser… Enfin si, il y a imageJ un bon outil grand public mais pas vraiment spécialisé pour l'imagerie biologique (rires). C'est mieux que se contenter de regarder les images à l'écran, je suis d'accord et il y a quelques années c'était juste "je regarde mes images à l'écran". Mais c'est vrai que les constructeurs en médecine (IRM, scanner, tomographie) peuvent être un peu intéressés pour participer à l'élaboration des softs d'analyses, mais en biologie pour l'instant ça n’intéresse pas grand monde. Les biologistes sont très désemparés par rapport à tout ça ; les images s'accumulent dans tous les coins et elles sont sous-utilisées car elles sont en grande quantité et les traiter "à la main" nécessiterait un temps considérable.

Parmi les derniers projets sur lesquels on travaille au labo, il y a le deep learning, l'apprentissage automatique. Un des domaines d'applications est le traitement d'images, mais il y a aussi le big data. Donc potentiellement en bio on pourrait l'adapter à peu près partout : dès qu'il faut trier des données hétérogènes. Ce sont des outils de data mining [NDLR : s'adressant aux étudiants] : vous avez intérêt à ne pas louper les cours de data mining parce que franchement c'est un truc qui sert, dans quasiment tous les domaines ! [NDLR : Nous conseillons aux étudiants de ne louper aucun cours 🙂 ]

Concernant le labo dans lequel je suis [NDLR : le LaBRI ], il s'agit d'un laboratoire d'informatique avec 300 personnes, quasiment que des informaticiens. L'organisation est différente de ce que l'on voit souvent en biologie avec des petits labos de 10-20 personnes. Le choix à Bordeaux a été de faire un seul gros labo d'informatique regroupant des gens qui travaillent sur les robots, la programmation parallèle, la théorie du langage, du traitement d'images, de la visualisation de grands jeux de données, de la bioinfo… Il y a un peu tout.

CD : Belle présentation ! Peux-tu détailler comment tu es passée de la modélisation à l'imagerie ?

MBA : Ah ! Alors à l'époque la bioinfo c'était transversal, sur plusieurs équipes. C'est d'ailleurs encore souvent ça dans les labos de recherche. Quand on a créé cette équipe au LaBRI, c'était majoritairement des gens qui faisaient de la génomique et de la combinatoire. Ce n'étaient absolument pas mes sujets de prédilection, je n'y connais absolument rien en génomique (rires) et le peu que je connaisse en biologie c'est de l'ordre du métabolisme.

Donc le sujet principal était assez éloigné de mes propres recherches et j'ai dit "moi je suis bien dans l'équipe imagerie, c'est une équipe sympa, j'y reste !".

Le logo du LaBRI

CD : Qu'est-ce qui t'a poussée à partir dans la recherche ?

MBA : Je m'ennuyais, je faisais de l'informatique de gestion j'ai trouvé ça ennuyeux à mourir. C'est très bien payé mais c'est vraiment ennuyeux. J’étais dans une société de services ce qui correspond à des sociétés qui louent du personnel pour d'autres entreprises ayant besoin de programmeurs. Cette expérience a été très formatrice. En plus, j'avais de la chance car on développait à demeure ; je n'allais pas chez le client et j'étais dans une équipe sympa puis… J'étais bien rémunérée : mon salaire net quand j'étais dans le privé, je l'ai récupéré en brut 10 ans plus tard en tant que maître de conférences. Entre temps j'avais passé ma thèse etc. (rires).

CD : Tout le monde voudra aller en SS2I après ça !

MBA : L’informatique est très bien rémunérée et le travail ne manque pas : partout dans le monde. Au Vietnam, où je vais enseigner, l’informatique a explosé notamment à Hô Chi Minh, les entreprises dans ce domaine sont très présentes. Il y a d'autres domaines où on peut également gagner beaucoup d'argent mais seulement une minorité va être embauchée, ce n'est pas le cas en informatique. En conclusion, les informaticiens qui sont à la fac ne les sont pas pour l'argent, ce serait stupide ! (rires).

L'informatique marche donc plutôt bien et on le voit au travers de notre master, notamment dans celui de Bordeaux où on essaye d’amener les étudiants à réaliser leur stage partout en France ou à l'étranger.

Julien Fouret : C'est dur financièrement pour un étudiant de faire un stage loin de son université.

MBA : Concernant les stages à l’étranger, il est possible que certains pays ne rémunèrent pas ses propres stagiaires ; par conséquent c'est compliqué d'être payé en tant qu'étudiant français : ça serait inégal entre les locaux qui ne sont pas rémunérés et les étrangers qui le sont. Par conséquent, il est possible d’avoir des arrangements tels que le remboursement du billet d’avion ou autres.

À Bordeaux, toutes les bourses provenant de la région, Erasmus etc. sont rassemblées en un seul tronc commun. Et il y a une procédure pour tous les étudiants qui partent en stage à l'étranger. Ils ont une bourse en fonction de la durée et du lieu de leur stage même si parfois cela devient un peu compliqué car pour certaines bourses il faut satisfaire les critères sociaux des parents alors que pour d’autres bourses ce n’est pas le cas. C'est donc une très bonne décision de la part de l'administration de l'université d'avoir créé cette procédure qui les regroupe toutes !

JF : Vous avez implémenté des programmes pour aider au diagnostic.

MBA : Ma spécialité c'est le GL [NDLR : Génie Logiciel]. Mais j'ai travaillé dans le diagnostic médical pendant ma thèse, sur une solution d'aide à la décision sur le rhumatisme inflammatoire. Le sujet demandait de faire un système bayésien sauf que moi je ne suis pas mathématicienne et comme mon directeur de thèse m'a laissée libre de faire ce que je voulais, j'ai fait autre chose (rires).
De toute façon, il y a deux situations en thèse : soit on est dans une équipe où l'on travaille sur la suite logique de la précédente thèse, tout est calibré, l'état de l'art est fait etc. Soit c'est un sujet nouveau, open, parfois peu encadré. Ce qui était mon cas, mais c’était un accord dès le début et c'est une situation que j'avais acceptée, j'avais environ 35 ans donc je me suis dit "ça va je survivrai" mais c'est mieux de prévenir à l'avance quand même. En effet, cette situation ne convient pas toujours pour les étudiants. Je côtoie des thésards qui sont dans cette situation-là et c'est dur pour eux.

JF : Les abandons de thèse sont une réalité malheureusement…

MBA : Je travaille à l'école doctorale d'informatique et dans ce domaine on a du mal à trouver des thésards car les gens trouvent un emploi facilement. Par conséquent ceux qui veulent faire une thèse sont vraiment motivés.

Au LaBRI, les équipes sont grandes et il y a des bureaux de thésards de plusieurs équipes mélangées, ça fait du bien aux thésards de ne pas toujours être avec ses encadrants. Dans notre équipe nous sommes 35 et nous essayons de proposer aussi un suivi des thésards en plus de celui des directeurs de thèse, pas scientifiquement, il s'agit plutôt de soutien moral.

Ce n'est pas un soutien scientifique parce que leur sujet ils savent le faire. Le soutien c'est plutôt de leur rappeler qu'il y a des conférences où ils doivent se rendre ou des papiers à soumettre etc. si le directeur de thèse ne le fait pas. C'est une charge que j'ai prise dans mon équipe de soutenir des thésards. On accueille aussi des étrangers et mine de rien c'est compliqué avec l'administration, le CROUS etc. Parfois en thèse on est fatigué et on n'est pas prêt à se battre contre la terre entière…
Enfin c'est l'avantage des gros labos : les thésards ont de la ressource, ils peuvent trouver de l'aide même en dehors de leur équipe, ça peut être plus difficile que dans les équipes plus petites.

JF : Une thèse reste très formateur en termes de relations humaines au travail.

MBA : Ou destructeur (rires). Il faudrait qu'une thèse reste une expérience professionnelle et n'aille pas jusqu'à la casse. Faire une thèse reste dur psychologiquement parlant, notamment car on pense sans cesse à son sujet pendant 3 ans, à la fin on est généralement au bout du rouleau, les fins de thèses sont toujours difficiles. Mon conseil : faire un sujet qui vous plaît ! De plus, je ne prends en thèse que des étudiants que j'ai déjà encadrés en stage, car c'est ardu d'encadrer un étudiant avec qui on ne s'entend pas, même s'il est très bon : pour les encadrants comme pour l'étudiant. Il vaut mieux se tester mutuellement (rires).

Crédits : u-bordeaux (tous droits réservés)

CD : Est-ce que tu peux nous parler du master de Bordeaux ? Qui a changé de programme il y a peu de temps ?

MBA : Maintenant c'est une mention, donc un master en tant que tel, pas une spécialité d'un autre parcours (avant nous étions une spécialité du parcours "Biologie, Santé"). À l'heure actuelle sur les diplômes de nos étudiants, il y a donc écrit "Master Bioinformatique parcours Biologie computationnelle" ou "parcours du Génome aux Écosystèmes".

Pour ce qui est de notre master, à sa création il y a une dizaine d'années, le choix a été fait de prendre des étudiants issus uniquement d'un parcours biologique et de leur faire faire de l'informatique. Et on a tenu le coup, les candidats étaient présents d'année en année et ce profil de master n'était pas trop répandu ailleurs. Le nouveau diplôme conserve cette orientation.

On fait un semestre algorithmique, programmation en Python, système d'exploitation, statistiques et un petit peu d'initiation à l'imagerie, en vue d'acquérir les bases nécessaires en informatique. À partir du deuxième semestre, en biologie computationnelle, on passe à de l'algorithmique avancée, de la programmation objet en Java, de l'approche aux bases de données, un peu de Perl, du NGS. Le second parcours peut prendre des options plus proches de la biologie ou partir faire le semestre à Bilbao avec qui nous avons un accord. Et on finit ce semestre avec un projet à 4 ou 5 étudiants et un client. Ils ont aussi le choix sur plusieurs options, certains vont alors encore plus se plonger dans l'informatique avec de la programmation en C/C++ quand d'autres choisiront de perfectionner leurs connaissances en imagerie par exemple. Arrivés au troisième semestre, ils touchent au data mining, au génie logiciel, à la structure 3D des protéines, et d'autres options sont à la carte comme la modélisation cellulaire, la programmation orientée objet (POO), statistiques avancées en environnement ou encore l'étude du génome. Ils ont aussi un projet de génie logiciel encore plus gros qu'en deuxième semestre, à 5 ou 6 étudiants, c'est souvent un bazar pas possible mais c'est vraiment formateur !

Et cette année, on a aussi commencé à faire des cours inversés (un étudiant propose de faire un cours pour tous les autres sur un thème précis) et c'était super sympa. Du coup, on a eu des cours sur SCRUM, sur le modèle objet de R, sur Ruby, sur le format JSON… Enfin que des choses qui ne sont actuellement pas couvertes par nos cours, et il y a vraiment eu des trucs chouettes ! On a aussi fait une initiation à la recherche (réalisation d'un article scientifique).

En fait, on essaye surtout de faire faire énormément de projets à nos étudiants et de leur apprendre à travailler en équipe. Un informaticien ne travaille jamais seul ou très rarement. Il faut apprendre à coder à plusieurs, rédiger les cahiers des charges, discuter avec un client sans forcément tout accepter. On apprend à "dealer" avec le client, à gérer ses demandes. Il faut que tout le monde finisse content, on a toujours en face de soi quelqu'un qui n'est pas informaticien - et c'est encore plus vrai dans la vie d'un bioinformaticien - donc il faut vraiment apprendre à gérer ça, à communiquer. Il ne faut pas forcément tout dire au client, il faut qu'ils aillent le voir, lui demandent ce qu'il veut puis qu'ils repartent, qu'ils discutent entre eux et qu'ils décident ce qu'ils vont faire et ne pas faire. Le client ça ne sera pas quelqu'un auquel ils pourront demander tous les jours "aujourd'hui je fais quoi ?". C'est un apprentissage de l'autonomie.

Ces 3 semestres servent à sortir de l'état d'étudiant. Alors oui, ceux qui iront en thèse continueront à être étudiants, mais il y aura eu un déclic. Ils auront aussi appris à travailler avec des gens qu'ils n'aiment pas forcément, car souvent en début de master c'est moi qui constitue les groupes de projets, ils doivent travailler en binôme avec quelqu'un qu'ils n'ont pas choisi et ils n'ont pas le choix ! Parce que la vie professionnelle c'est aussi ça, on ne travaille pas toujours avec des gens qu'on aime, ou avec des personnes plus "fortes" que soi sur qui on pourra se reposer.

CD : Tu penses justement que c'est quelque chose qui manque aux autres formations de bio-info ce côté projets et programmation ?

MBA : D'après les retours que j'ai eus de chercheurs travaillant entre autres à Toulouse, les étudiants de Bordeaux sont appréciés parce qu'ils font plus de projets : ils sont habitués à travailler à plusieurs, à être autonome etc. Parce que souvent en bio-informatique il n'y a personne pour encadrer techniquement les bioinfos dans les labos. C'est aussi pour cela que le master de Bordeaux est clairement un master de développement logiciel.

CD : Est-ce qu'il y a des gens ou des projets qui t'ont marqué durant ta carrière ?

MBA : J'ai beaucoup apprécié croiser Denis Thieffry au tout début de ma carrière en bioinfo, c'est la première fois que je n'étais pas capable de dire si une personne était informaticien ou biologiste en formation initiale. Ce fut assez surprenant.

J'ai eu d'autres anecdotes assez marrantes par exemple à une époque je travaillais sur le métabolisme carboné de la tomate et je voulais faire un projet avec le Vietnam, j'ai discuté avec plusieurs chercheurs à propos du riz. En rentrant sur Bordeaux j'explique qu'après avoir fait le réseau métabolique de la tomate on pourrait faire celui du riz, mais pour les biologistes c'était considéré comme très différent. j'ai demandé "C'est quoi la différence ? - Ben c'est pas pareil" (rires). Pour un informaticien que ce soit des choux ou carottes c'est pareil en fait… Un réseau métabolique c'est un réseau métabolique et graphe c'est un graphe… c'est anecdotique mais ça illustre bien la différence entre les deux cultures : informatique et biologie, on pourrait sûrement trouver un exemple dans l'autre sens de différences en informatique qui ne le sont pas en biologie.

CD : On m'a dit que t'avais rencontré Richard Stallman ?

MBA : Oui oui il aime venir à Bordeaux. C'est quelqu'un de très atypique. Une fois je suis allée le chercher à la gare, il avait son ordinateur portable, il monte dans la voiture il ne dit pas bonjour ni rien… bon, il m'a dit bonjour quand sa compilation s'est terminée !

Une autre fois on m'avait chargé d'aller le chercher sur le parking de la fac pour un groupe de travail. Après l'avoir aperçu, je le fais monter pour l’emmener au labo. Le trajet était un peu long je ne savais pas quoi lui dire. Je sors une question bateau par politesse : "Alors Bordeaux ça vous plaît ?" il m'a répondu "Comment est-ce que je pourrais avoir un avis en ayant passé que 3 jours ici ?" Ok, c’était pas faux, il vaut mieux zapper les politesses, on va se contenter de conduire ! (rires)

Mis à part ça il est rigolo parce que comme il est souvent traité de gourou, à l'époque il amenait une grande tunique et un vieux disque qu'il mettait en auréole, puis il chantait la chanson des GNU en tournant sur la scène. Puisqu'il était accusé d'être un gourou il jouait le jeu jusqu'au bout ! C'est quelqu'un de très 2éme/3éme degrés. Cependant il n'a pas le vernis éducation (rires), il ne s’embarrasse pas de choses futiles… Enfin il a fait des choses colossales quasiment tout seul ; la GPL et toutes les briques du système GNU/Linux qui ont été ensuite intégrées par Linus Torval.

Richard Stallman, le gourou parlant à ses disciples. (Source : NicoBZH, CC-BY-SA)

Les informaticiens sont souvent des animaux un peu étranges (rires).

CD : Dernière question : Quel est ton avis sur l'évolution de la bio-informatique ?

MBA : Je suis mal placée pour répondre à cette question. J'étais à une soutenance de thèse il y a plus d'un an avec un chercheur canadien -biologiste- qui lui me disait qu'un biologiste moléculaire qui ne fait pas d'informatique serait mort dans 10 ans. Dominique Rolin m'a dit la même chose. Il y aura la même révolution en biologie
moléculaire que celle qu'il y a eu en biochimie. C'est devenu incontournable compte tenu de la quantité de données produite. Maintenant on ne peut plus se passer des ordinateurs. Je peux comprendre que pour un biologiste voulant à l'origine faire de l'expérimentale, se retrouver devant un ordinateur ne soit pas forcément sympa.

En bio-informatique, il reste énormément à faire : la biologie est énorme, l’informatique est énorme et la bio-informatique est l'addition des deux. Il y a beaucoup d'offres d'emploi en ce moment c'est vraiment l'âge d'or : on a des besoins en bio-informatique dans des domaines très variés : dynamique moléculaire, imagerie, les bases de données, la génomique, les simulations, les robots etc. Chacun peut trouver son bonheur !

Merci à Kumquatum, Nisaea et Jnsll pour la relecture ! Ainsi qu'à Yoann M. et Julie Hardy pour m'avoir aidé pour la retranscription. Enfin merci à Julien Fouret pour l'organisation de ce premier TOBi à Lyon et merci également à tous ceux et celles qui étaient présent(e)s !

Auteur / autrice

Julien Fumey

Issu du master de bioinformatique de l'université Paris Diderot, j'ai réalisé une thèse en génomique des populations chez le poisson aveugle Astyanax mexicanus. Ancien président (2014-2017) de l'association des Jeunes Bioinformaticiens de France (RSG France - JeBiF), je suis membre du conseil de la SFBI depuis juillet 2015.
@julienfumey

Voir toutes les publications

Partagez cet article

Pour continuer la lecture :

Commentaires

Une réponse à “Questions à… Marie Beurton Aimar”

bli

7 août 2017

Les carabes sont des insectes, en tout cas ceux-là : https://fr.wikipedia.org/wiki/Carabidae

Répondre

Laisser un commentaireAnnuler la réponse.

Pour insérer du code dans vos commentaires, utilisez les balises <code> et <\code>.