Les Journées Ouvertes Biologie, Informatique et Mathématiques version 2015, organisées par l'Université d'Auvergne, se sont déroulées au Polydôme de Clermont-Ferrand du 6 au 9 juillet. Cette conférence était l'occasion de rassembler les communautés de diverses disciplines, dont la bioinformatique, la biomathématique et les biostatistiques. Les différents thèmes abordés étaient regroupés en sessions, chacune articulée autour d'un invité d'honneur.
Les réactions des participants étaient disponibles tout au long de la conférence sur Twitter grâce au mot-dièse #JOBIM2015. Et pour ceux n'ayant pas pu y assister, nous revenons ici succinctement sur les onze thématiques abordées lors de cette 16ème édition des JOBIM.
Un point informations en vrac avant de débuter le résumé des différentes présentations : cette année nous étions 382 participants. L'équipe chargée de l'organisation s'articulant autour du maître de cérémonie, Phillipe Leroy et son vuvuzela, s'en est parfaitement bien sortie, encore un grand bravo à elle pour cela.
Dès notre arrivée nous nous sommes vu remettre nos badges d'accès ainsi qu'un sympathique pack de bienvenue composé :
- d'un pointeur laser (aucun cas de cécité visuelle n'a été déclarée au cours de la conférence)
- d'un stylo-USB siglé "JOBIM2015"
- d'une bouteille de Volvic importée du (ou destinée au) Japon
- de deux polycopiés reprenant les différents résumés des conférences et posters présentés
- d'un ticket de transport couvrant les dates de la conférence
- d'un flyer publicitaire pour JeBiF
- d'un sac besace lui aussi siglé "JOBIM2015".
Workshop JeBiF
JOBIM a débuté cette année avec le workshop organisé par l'association des Jeunes Bioinformaticiens de France (JeBiF — RSG France) qui avait lieu le dimanche 5 juillet après-midi et le lundi 6 juillet matin. Les 65 participants ont été accueillis avec un welcome pack, moins fourni que celui de JOBIM puisqu'il contenait simplement le programme et un badge aux couleurs de l'association (on me glisse d'ailleurs dans l'oreille que le badge a fait un petit effet et qu'il se pourrait que d'autres reprennent l'idée).
Durant ce workshop il a été question d'emplois en bioinformatique. Le workshop a pris la forme de quatre tables rondes thématiques où deux à trois intervenants répondaient aux questions des participants. Les thèmes abordés étaient :
- "la bioinformatique dans le public et dans le privé"
- "la bioinformatique à l'étranger"
- "la bioinformatique dans le domaine médical"
- "l'importance du réseau professionnel"
À cela se sont ajoutées une présentation de l'entreprise de services en bioinformatique GenoSplice et de l'Institut de Recherche Technologique BIOASTER. Les formations bioinfo en Auvergne (Master de Clermont-Ferrand et DUT d'Aurillac), ainsi que bioinfo-fr.net (oui oui, ça c'est nous !) ont également pu être présentés aux participants de ce workshop.
1er jour
La première après-midi a débuté avec la session "Biochimie, Biologie structurale & Bioinformatique Structurale". C'est Christine ORENGO de l'University College London (UCL) qui a débuté en nous proposant une présentation autour de l'étude de l'évolution des fonctions protéiques. En plus de son travail, elle nous a présenté FunTree qu'elle a pour habitude d'utiliser dans ses travaux.
Puis vint le tour d'Hamed Khakzad de l'Iran University of Science and Technologie qui nous présenta sa méthode d'optimisation de prédiction des structures protéiques en passant par le GPU (on notera qu'il arrive au final grâce à ça à optimiser ses vitesses de prédiction d'un facteur 34). Isaure Chauvot de Beauchene de la Technical University Munich a superbement enchaîné (et remporté par la suite le concours de la meilleure présentation orale !) en nous décrivant ses travaux de modélisation des jonctions ARN-proteine. On se souvient tout particulièrement de sa métaphore si bien trouvée : un Gaston Lagaffe (symbolisant une protéine pas très flexible) portant son double en latex (symbolisant un ARN très flexible). Isaure a, entre autre, développé un moyen de prédire très précisément où se situera la jonction entre l'ARN et la protéine.
Seyed Ziaeddin Alborzi eut la lourde tâche de succéder à cette très belle présentation. Sa nouvelle méthode statistique mise au point et baptisée EC-PSI est capable de trouver les nomenclature EC relatifs à des domaines Pfams d'une manière 6 fois plus rapide que ce qui existe à l'heure actuelle.
Enfin, c'est Marco Pasi de l'Université Lyon1 qui termina cette session autour d'une présentation intitulée "Sequence determines the structure and microsecond-scale dynamics of B‑DNA and its bound cations", tout est dans le titre ! Pour les curieux, Marco Pasi travaille sur les spécificités ADN-facteur de transcription en utilisant un "second code génétique". Il utilise la flexibilité de l'ADN et la dynamique de son squelette pour améliorer les modèles de fixation des facteurs de transcription en utilisant deux matrices, une classique de séquence et une seconde, physique représentant la structure de l'ADN.
La fin de l'après-midi était quant à elle dédiée à une session "Évolution, Phylogénie & Paléogénomique". Le keynote speaker de cette session n'était autre que Ziheng Yang de l'University College London qui nous a fait une présentation sur comment faire des titres de diapositives très très très long estimer le temps de divergence entre différentes espèces en combinant des données moléculaires avec des données paléontologiques (des fossiles).
Puis ce fut au tour d'Elodie Cassan de l'Université de Montpellier de nous présenter ses travaux s'axant autour de l'étude de l’évolution d'une partie du complexe HIV‑1 M. Et c'est Blerina Sinaimeri de l'INRIA Grenoble qui nous présenta ensuite COALA (non, il n'y a pas de faute), son logiciel maison qui lui permet de mieux prédire l'histoire et l'évolution des associations hôte-parasite à partir d'une méthode Bayésienne approximative.
Après cette sympathique présentation, c'est Gabriel Markov qui nous fit l'honneur de nous introduire ses travaux autour des différentes familles de nématodes et de l'étude de l'orthologie existante entre elles. On a pu constater que le problème était plutôt complexe et que de nombreuses choses restent encore à découvrir dans le domaine.
Cette première journée déjà riche en informations scientifiques s'est terminée avec des annonces diverses. La première annonce, par Christoph Grunau, concernait le Réseau Thématique Pluridisciplinaire "Épigénétique en Écologie et Évolution" (RTP-3E). Dominique Joly nous a ensuite présenté le nouveau Groupement de Recherche en génomique environnementale.
Venait ensuite Julien Fumey pour présenter JeBiF, et enfin Yoann Mouscaz pour présenter bioinfo-fr.net (et oui, c'est encore nous ! On a bien fait notre pub !).
2ème Jour
Ce deuxième jour a débuté avec la troisième session "Organisation et expression des génomes". C'est Stéphane Rombauts du VIB (Belgique) qui a commencé en nous présentant son prochain gros challenge : le séquençage, l'assemblage et l'annotation des génomes complexes. Sa présentation, très bien ficelée de bout en bout, nous a permis de (re)découvrir l'évolution du séquençage (techniques, machines, coûts). Puis d'entrevoir les nouvelles technologies en vogue du moment (PACBIO et MinION pour ne citer qu'eux) ainsi que quelques logiciels que Stéphane utilise dans son travail de tous les jours, comme EuGene par exemple.
Jérémy Tournayre, de l'Unité Mixte de Recherche sur les Herbivores de l'INRA, nous a ensuite présenté Fat&MuscleDB. Cette base de données est dédiée a regrouper les données protéiques et transcriptomiques des tissus musculaires et adipeux bovins à différents stades de développement.
Ce fut ensuite au tour d'Alexandre Cormier, de la Station Biologique de Roscoff (CNRS/UPMC), d'exposer son travail, relatif à la différence d'expression des gènes en fonction du sexe de l'individu. Cette étude, centrée sur l'algue brune Ectocarpus, mesure également les taux d'évolution de ces gènes, par comparaison des données transcriptomiques de leurs orthologues, dont l'assemblage a été réalisé de novo via Trinity. Il a ici été mis en avant l'importance de l'association de différentes techniques bioinformatiques dans la résolution de questions d'ordre biologique.
Frédéric Choulet, de l'INRA et Université Blaise Pascal (UBP), a ensuite clos cette session en nous dévoilant la création de la première séquence de référence du plus long chromosome du génome du blé tendre. Cette avancée ouvre la porte au séquençage complet de ce génome, d'un intérêt majeur pour l'industrie agronomique. Il en profite pour citer quelques outils faits maison tels que ClariTE et ClariTERep que nous vous invitons également à découvrir sur ce dépôt.
La session suivante était une session "spéciale invités", en d'autres termes : c'était du lourd. Thomas Walter de l'Institut Curie a ouvert le bal en nous présentant son domaine : le High Content Screening (HCS). Cette technique lui permet entre autre de détecter les noyaux cellulaire et de pouvoir ainsi observer et filmer divers processus biologiques comme la division cellulaire. Il présenta ainsi ses outils de prédilection, dont CellCognition qui est un outil d'analyse d'image open-source. Thomas termina sa présentation en introduisant le réseau France BioImaging.
Daniel Segrè de l'Université de Boston prit la suite en nous présentant ses travaux autour du microbiote des dents grâce à son logiciel maison COMETS, open-source lui aussi. Grâce à ce logiciel, il est possible de modéliser dans le temps et l'espace l'évolution des différents microorganismes étudiés. Il s’intéresse principalement aux flux et présente ses résultats obtenus grâce à la méthode de Flux Balance Analysis (FBA).
Vint ensuite la maintenant traditionnelle présentation de Jean-François Gibrat (que nous avions interviewé il y a bientôt 3 ans) qui nous a décrit l'état de l'art de l'Institut Français de Bioinformatique (IFB). L'IFB est devenu le nœud français d'ELIXIR et rassemble en tout 32 plateformes dispersées sur 6 centres régionaux.
Cela nous a permis de constater avec joie que l'IFB a su se fédérer au fil du temps et qu'il ne lui manque maintenant plus qu'à faire et à asseoir sa réputation.
Nous avons par la suite suivi les sessions parallèles. Nous avons pu assister à la présentation de Lucas Auer de l'Université de Toulouse qui nous a parlé de FROGS (Find Rapidly OTU with Galaxy Solution). FROGS est un pipeline dédié aux biologistes, axé autour de Galaxy. Le pipeline part de l'échantillon biologique, passe par les fichiers bruts pour arriver à des tables d'abondance. Plus d'informations sur FROGS ici.
Puis c'est Bryan Brancotte qui a enchaîné avec son outil : ConQuR-Bio. Ce dernier, à découvrir de toute urgence, permet d'interroger les bases de données du NCBI en produisant toutes les reformulations possibles et imaginables afin d'amener des réponses triées. Bryan nous a même fait remarquer que son outil donnait 44% de "meilleurs résultats" que le NCBI lui-même. Chapeau !
Pendant ce temps, dans une autre session parallèle, Jacques Van Helden et Morgane Thomas-Chollier nous ont présenté leur ensemble d'outils RSAT (Regulatory Sequence Analysis Tools), qui permet au même titre que la suite MEME, plus connue, de découvrir des motifs dans des jeux de séquences. Ils nous ont également présenté d'autres outils disponibles sur leur site web, un outil afin de hiérarchiser des motifs sous forme d'arbre ou encore pour faire de la génomique comparative dans la recherche de motifs au sein d'orthologues. Ensuite c'est Laurent Bulteau et son outil DINGHY (Dynamic Interactive Navigator for General Hypergraphs in Biology) qui ont prolongé cette session. Son outil permet de visualiser des hypergraphes de réactions métaboliques très facilement. A noter qu'il est possible de visualiser d'autres types de données.
L'après-midi était consacrée à la "méthodologie pour l'analyse des séquences et des données omiques".
Anthony Cox, de l'équipe Illumina de Cambridge, débute en nous informant sur les nouvelles méthodes à disposition pour manipuler efficacement des milliers de génomes humains. Le logiciel BEETL-fastq permet ainsi de compresser et d'indexer des séquences de format fastq, permettant un gain notable d'espace disque ainsi qu'un accès plus rapide aux données, tout en conservant les spécificités du format.
Vint le tour d'Aymeric Antoine-Lorquin de l'IRISA (Université de Rennes), qui nous parla de facteurs de transcription et de la découverte de leur motif de fixation sur l'ADN en utilisant les expressions régulières au lieu des classiques matrices de comptage.
Puis c'est Mathilde Le Boudic-Jamin (contributrice du blog) également de l'IRISA, qui nous présenta son outil de détection des répétitions de structures dans les protéines : Kunoichi. Pour la petite histoire, Mathilde a nommé tous ses programmes maison avec un nom de samouraï. Vous pouvez vous essayer à Kunoichi (et ses amis) en contactant directement Mathilde et ses collègues.
Morgane Thomas-Chollier de l'Institut de Biologie de l'ENS revint sur scène et nous parla ensuite d'ExoProfiler, une méthode pour analyser des données de ChIP-exo, beaucoup plus précise sur le positionnements des facteurs de transcription sur l'ADN. Elle nous parla notamment de la différence de comportement des fragments d'ADN séquencés dans le cas de dimères de facteurs (qu'ils soient homo- ou hétéro-).
Et ce fut Nicolas Terrapon du Laboratoire Architecture et Fonctions des Macromolécules Biologique (CNRS/Univ. Aix Marseille) qui eut la lourde tache de clôturer les présentations scientifiques de cette deuxième journée. Nicolas nous a présenté la base de donné CAZY qui existe depuis 1998. CAZY pour Carbohydrate-Active enZYme modules. Ses travaux portent sur le microbiote de l'intestin humain et les complexes polysaccharides s'y trouvant. Il s'intèresse à la manière dont ce microbiote casse les complexes polysaccharidiques. Pour l'aider dans cette tache, il a développé avec son équipe une base de données qui est accessible dans CAZY : PULDB. Pour information, PUL signifie Polysaccharide Utilization Locus.
La journée s'est terminée par la présentation de l'IUT de bioinformatique d'Aurillac et du master Bioinfo de l'Université Blaise Pascal de Clermont-Ferrand.
3ème jour
Ce troisième jour débuta avec la sixième session plénière intitulée "Métaomiques & Génomique environnementale". Rob Finn de l'EBI nous parla d'analyses taxonomiques au sein d'un métagénome, en utilisant les ARNr 16S. Il nous présenta également la plateforme ENA que l'EBI a mis en place pour l'archivage et l'analyse de données métagénomiques.
Guy Perrière du Laboratoire de Biométrie et Biologie Évolutive de Lyon nous présenta ensuite RecStat, package R permettant de prédire la position des CDS en utilisant une analyse de correspondance sur des données de métagénomiques. Pour la petite histoire RecStat date de 1987 et était initialement codé en Fortran. Guy nous a fait une rapide revue de toute sa boite à outils logiciels pour ses analyses en nous amenant gentiment à la conclusion que bien que très ancien originellement, RecStat était encore aujourd'hui celui qui s'en sortait le mieux, même avec l'arrivée de petits nouveaux.
Puis Faouzi Jaziri de l'Université d'Auvergne à Clermont-Ferrand pris la suite avec son logiciel maison : PhylInterpret développé en C++ lui permettant d'analyser des résultats issus d'analyses de biopuces.
La session suivante était dédiée à la Biologie translationnelle et à la pharmacogénomique. Cette session a débuté avec une très très longue présentation de Ana Conesa de l'Université Principe Felipe en Espagne sur l'état de l'art dans les analyses omiques en général et multi-omiques en particulier. Un certain nombre d'outils ont été présentés, à utiliser en fonction de type de données, et du nombre de features utilisés dans l'analyse : omics fusion, tcalNetworks, MetAnalysis Combine, HolisOmics, PaintOmics, multionicstrees, Pairwise TimeCourse Analysis et Pathway Network Analysis, pfiou ça en fait des outils à regarder…La diapositive que l'on a beaucoup aimé dans la présentation d'Ana vous est offerte ci-dessous :
Lors des sessions parallèles qui ont suivi (et que nous avons choisi de suivre), c'est Laurent Jourdren qui a commencé par nous introduire à son gestionnaire de workflows en lignes de commande : Eoulsan2. Ce dernier s'est même risqué à une live-demo, bravant avec courage et triomphant par la même occasion du célèbre effet Bonaldi ! L'outil à l'air sympa et nous vous encourageons à aller le découvrir pour ceux qui seraient tentés par la gestion de workflows d'analyses NGS.
Puis ce fut Stéphane Télétchéa qui emboita le pas avec DockNmine, une application web maison à base de Django et de WebGL permettant de visualiser et de comparer des interactions entre des ligands et leurs cibles. Son développement devrait prendre fin d'ici fin 2015 et sa mise en ligne devrait suivre dans ces eaux là. La présentation faite à largement suffit à nous donner l'eau à la bouche !
Et ce fut à Delphine Steinbach de l'INRA Versailles à qui revint la lourde tâche de clôturer cette séance de sessions parallèles, elle nous présenta GnpIS son système d'information conçu pour les données génomiques, génétiques et aussi phénotypiques végétales. Puis vint GnpIS-Asso qui amena des fonctionnalités supplémentaires à l'outil. Nous vous conseillons d'aller le découvrir et l'essayer si vos études portent sur des végétaux.
Dans une autre session parallèle Magali Berland nous a fait une démonstration avec METEOR et MetaOMineR pour l'analyse de biomarqueurs au sein de données métagénomiques. Ensuite Bérénice Batut (qui fait parti de nos auteurs) nous a présenté ASAIM, un pipeline d'analyses métatranscriptomiques du microbiote intestinal. Enfin, Alexandra Louis nous a présenté Genomicus un outils de visualisation d'arbre et de comparaison phylogénétique entre espèces proches. Un gros travail a été fait sur la visualisation qui est très intuitive et il est très facile de naviguer sur le site. À noter que l'on peut visualiser des comparaisons de nombreux génomes, récupérer une prédiction du génome des nœuds dans l'arbre, mais également comparer deux génomes entre eux. Je vous conseille d'aller faire un tour !
L'après-midi a commencé avec l'Assemblée Générale Ordinaire de la Société Française de Bioinformatique (SFBI). Le bilan moral de la société a été présenté par sa présidente Sophie Schbath. À noter que cette année, la SFBI fête ses 10 ans et que à cette occasion elle organise un concours de logo afin de rafraichir son image. Un nouveau site web devrait également arriver d'ici à la fin de l'année. Stéphane Téletchéa, trésorier de la société, a ensuite fait le bilan comptable. Les deux bilans, moral et comptable, ont été validés à l'unanimité. L'assemblée générale de la SFBI était également le moment de renouveler le bureau (qui est renouvelé d'un tiers tous les ans). Les 3 sortants étaient Marie Chabert et Valentin Guignon et Céline Brochier. Cette dernière ne se représentant pas, une place était vacante. Et c'est ainsi Julien Fumey qui a intégré le bureau de la SFBI (oui oui, celui qui est déjà président de JeBiF et rédacteur dans ces colonnes. D'ailleurs, cela lui a valu le titre de deuxième triploïde de l'histoire après Magali Michaut !).
La session "Épigénétique et épigénomique" débute avec Christoph Grunau de l'Université de Perpignan qui présenta les enjeux des analyses épigénétiques sur l'environnement et l'évolution sur les organismes non-modèles. Il nous a partagé son travail sur le design d'expériences afin d'identifier des marques épigénétiques.
Daniel Jost de l'Université de Grenoble, continua cette session en nous présentant son travail sur les interactions entre les différents états de la chromatine qui influencent l'organisation au sein du noyau. Il répond ainsi à la question : comment une structure 1D (Epigenome) détermine la structure 3D (compactome) de l'ADN en représentant la chromatine comme des blocs de copolymères.
Le soir du troisième jour était réservé pour la soirée de Gala, qui se déroulait cette année à Vulcania ! Après avoir vu un film en 5d (3d + projection d'eau + mouvement des sièges) dans lequel une vache était sauvée d'une mort certaine pendant une éruption volcanique grâce à un treuil accroché à un hélicoptère venu spécialement pour elle (c'est beau!). À la suite de ce petit film, un cocktail fut servi pendant que de la musique était jouée par un… bagad (l'Auvergne, la Bretagne c'est un peu pareil de toute façon). Bon en fait il devait s'agir de folklore auvergnat… Vint ensuite l'heure du repas (qui n'avait pas été oublié cette année, miracle !).
Puis après le repas, le bagad revint et initia ceux qui le souhaitaient à différentes danses auvergnates bretonnes auvergnates (oui en fait on ne sait vraiment pas). A noter que durant la soirée de gala, il y a également eu une tombola truquée avec à la clef : 10 clés USB d'une capacité de 64Go à gagner, un disque dur externe , ainsi qu'un iPad air 2. Bravo au bureau de la SFBI aux heureux gagnants !
4e Jour
Le quatrième et dernier jour fut dédié, pour les survivants de la soirée de gala, aux "Services, ressources & infrastructure pour la bioinformatique". La session a commencé avec Katharina Huber de l'University of East Anglia qui nous parla de comment gérer des "big data" dans le domaine de l'évolution et qui passa aussi en revue des méthodes de reconstruction de phylogénie.
Nicolas Daccord du CNRS d'Evry nous présenta ensuite sa base de données TopoIBase conçue pour les ADN-topoisomerases de type IA et qui comptait à la date de la présentation environ 1800 entrées uniques, principalement des bactéries. Il a implémenté tout cela lors de son stage de fin d'étude.
Puis Vincent Henry, de StatsArray et du CHU / Université de Rouen, nous introduisit au très utile OMICtools : un workflow pour l'étude de données omiques, qui regroupe plus de 7 800 outils, répertoriés par technologies et types d'analyse. Le petit plus d'OMICtools, c'est que les utilisateurs des outils peuvent interagir avec les descriptions et "avis" des dits outils et ainsi apporter une touche de fraicheur.
C'est ensuite Mélanie Pétéra de l'INRA Clermont-Ferrand qui ferma ces présentations scientifiques de JOBIM2015. Elle nous présenta sa plateforme en ligne qui héberge et fournit des pipelines entiers dédiés à l'analyse de données issues de la métabolomique. L'analyse proprement dite va du pré-processing à l'annotation, en incluant les analyses statistiques. Cette merveilleuse plateforme à découvrir sans plus attendre se nomme Workflow4Metabolomics (W4M pour les intimes).
Le programme scientifique de JOBIM 2015 se finissait là, mais quelques annonces eurent encore lieu, et notamment la plus importante et la plus attendue. Tout le monde était im-pa-tient (car non personne ne le savait avant l'annonce, non non non) de savoir où aurait lieu JOBIM2016. Et ce sera… Ah pardon ! On nous signale qu'il y a eu les prix avant.
La SFBI avait donc organisé un concours de la meilleur présentation orale et des deux meilleurs posters. Comme annoncé plus haut, le prix de la meilleure présentation orale fut remporté par Isaure Chauvot de Beauchene et le prix des deux meilleurs posters par Gaétan Benoit et Charlie Pauvert. Bravo à eux !
On nous signale également qu'un prix des plus gros fêtards aurait été remis à l'équipe du C3BI (Institut Pasteur), mais cette info est encore à vérifier…
Et rendez-vous à Lyon en juin 2016 pour la prochaine édition de JOBIM que l'on espère aussi réussie que cette édition et avec un programme scientifique aussi riche et passionnant.
Pour finir, nous vous proposons une petite analyse des tweets publiés pendant la durée de la conférence, grâce au mot-dièse #JOBIM2015. On voulait vous en parler un peu plus que ça, mais il est impossible d'accéder aux tweets datés de plus de 30 jours (et cette partie de l'article a été écrite bien après cette limite). On remercie donc waqueteu pour les stats qu'il avait fait durant la conférence (le mec prévoyant !).
Et sans surprise, le plus gros twittos de cette édition est… Oh bah c'est nous !
On donne rendez-vous l'année prochaine aux twittos à #JOBIM2016.
Merci aux relecteurs : Kumquatum et Wocka
Cet article a été rédigé par Clem_, Yoann M., m4rsu et LauGre.
Pour aller plus loin :
Laisser un commentaire