Conférence :
ECCB'14 à Strasbourg - le bilan

ECCB'14

eccb_banner_green
La conférence ECCB 2014 s’est déroulée cette année du 7 au 10 septembre 2014 à Strasbourg. Elle était couplée avec JOBIM et donc co-organisée par la SFBI. La conférence était précédée par 2 journées de workshops et tutoriels.

Le programme complet est accessible à l’adresse suivante : www.eccb14.org

Les workshops et tutoriels en marge de la conférence se sont déroulés à la faculté de médecine de Strasbourg. Dans une ambiance bon enfant, on a pu assister à des ateliers très ciblés tels que l’analyse des isoformes par RNA-seq ou les approches informatique du dichroïsme circulaire et à des tutoriels sur des outils comme bioJS ou Galaxy.

La conférence a réellement débuté le dimanche soir avec en invité d’honneur comme premier orateur Jean-Marie Lehn. Bien qu’assez loin de la bioinformatique, sa présentation de structures chimiques artificielles s’auto-arrangeant en double-hélice était extrêmement intéressante. Le cocktail qui a suivi a été l’occasion de rencontrer pour la première fois la quasi-totalité des participants et de constater l’importance du congrès puisque près de 1100 personnes étaient présentes.

Lundi

Le lundi matin, la première conférence était une keynote de Patrick Aloy sur les stratégies thérapeutiques utilisant les réseaux métaboliques. Cette présentation a été la première d’une longue série traitant du croisement de données externes avec des données médicales. Nous nous sommes ensuite répartis en deux groupes, certains ont suivi les sessions sur les réseaux métaboliques et d’autres sur la génomique des populations.
La session « réseaux métaboliques » a démarré par la présentation de « HubAlign », un outil d’alignement de protéines impliquées dans un réseau. L’outil est très efficace car il tire parti de la séquence des protéines et de ses interactions avec les autres protéines. La présentation suivante a traité du même sujet. L’outil présenté (Netdis) était, cela dit, bien moins convaincant. Ensuite, nous avons assisté à une présentation sur la randomisation des grands sets de données. La randomisation des sets de données est nécessaire pour extraire des modèles combinatoires de données génomiques de cancer. BeRewire a été développé dans ce but et est disponible comme package R dans Bioconductor.

Après la pause, la session sur le séquençage et l’analyse des génomes a débuté. Le premier outil présenté, « lambda » permet l’alignement local de données en grand volume. La vitesse de l’outil pour aligner des séquences est très impressionnante… comparée à un BLAST. En revanche, face à des outils plus récents, il est difficile de dire si il y a vraiment un avantage sans le tester. On nous a présenté ensuite « FIONA », un programme permettant de corriger les erreurs de lectures des séquenceurs. La stratégie se base sur la fréquence d’apparition des erreurs à une position donnée. Il y a besoin d’une couverture suffisamment élevée pour que cette méthode soit efficace mais elle permet d’améliorer un peu les assemblages. Durant la dernière conférence de la matinée, on nous a présenté une comparaison d’algorithmes d’alignement de séquences provenant de séquenceurs Ion Torrent. L’objet de la présentation était surtout de nous montrer deux outils, « CuReSim » et « CuReSimEval » permettant respectivement de simuler des reads et d’évaluer les résultats d’alignement par différents algorithmes. Des outils qui peuvent se montrer très utiles finalement.

Nous sommes passé ensuite au repas, avec le défi de faire déjeuner plus de 1000 personnes en une petite heure. Malgré ce timing très serré, il faut avouer qu’il n’y a pas eu de problème de ce coté, même si on aurait apprécié d’avoir un peu plus de temps pour continuer les discussions entamées pendant les déjeuners.

L’après-midi a débuté par la deuxième partie de la session séquençage. Au programme deux outils de recherche d’haplotypes (FastHap et probHap) et un de détection de CNV (cnvOffSeq). N’étant pas un spécialiste du domaine, j’aurais du mal à émettre un avis sur ces outils, surtout dans le cas des halotypes. cnvOffSeq m’a paru très performant et mérite d’être testé.

IMG_0430

La dernière session de ce lundi était consacrée à nouveau aux réseaux métaboliques. Une première conférence expliquait une méthode d’identification de facteurs de transcription. L’algorithme DACO a semblé assez efficace. Ensuite nous avons écouté une présentation sur l’identification de réseaux métaboliques modifiés dans les cellules cancéreuses. Et enfin nous avons terminé la session par un séminaire sur les miRNA et leur lien avec les réseaux métaboliques. Cette dernière conférence était très instructive et j’ai pu apprendre beaucoup de chose sur les miRNAs.

IMG_0431

La journée s’est terminée par la session posters. 500 posters que je ne résumerai pas mais qui étaient pour beaucoup d’entre eux de très bonne qualité. Contrairement aux conférences qui s’attardaient très peu finalement sur l’aspect bioinformatique du travail pour laisser plus de place à l’aspect biologique des résultats, les posters mettaient plus en avant le coté informatique et n’hésitaient pas à montrer des algorithmes ce qui fait toujours plaisir. Le seul regret est que 2 heures, c’est un peu court pour tout voir mais les posters restant affichés pendant trois jours, on peut toujours y revenir un peu plus tard.

Mardi

La journée du mardi a débuté par une présentation sur les avancées en data mining. Au final assez peu d’information dans cette keynote sinon quelques outils comme KNIME, utile pour le data mining. Ensuite dans le cadre de la session sur la découverte d’information biologique dans les données, nous avons assisté à trois conférences. La première sur la recherche d’information en croisant des données de cribles chimiques. Conférence très intéressante même si le sujet était loin de mes préoccupations. La deuxième conférence était tout aussi intéressante et traitait de la recherche de l’espace occupé par des composés chimiques utilisés dans la lutte contre le cancer. Il était intéressant de constater que des molécules avec des compositions et des structures différentes peuvent finalement occuper le même espace et agir ainsi de la même manière comme inhibiteur d'enzyme par exemple. La dernière, sur les interactions des molécules bioactives, était en revanche un peu moins passionnante.

Après la pause, s’est déroulée la session sur l’expression des gènes qui a duré jusqu’à la fin de la journée. Nous avons commencé par une conférence sur l’expression des facteurs de transcription puis nous avons enchainé sur une jolie utilisation des chaines de Markov pour la modélisation de la dynamique de méthylation de l’ADN.
Après le repas Ewan Birney, directeur de l’EBI a fait une présentation sur les « big data ». On a pu voir à cette occasion l’impressionnante infrastructure de l’EBI ainsi qu’une présentation d’un nouveau mode de stockage d’information sur un support peu commun, l’ADN. Ce procédé, encore à ses débuts, est un peu lent en écriture car la synthèse d’une molécule d’ADN avec l’information souhaitée prend du temps, mais est très rapide en lecture et surtout en copie.
L’après-midi s’est poursuivi par la fin de la session sur l’expression des gènes, avec notamment une présentation sur la segmentation des HiC et sur l’influence de la position de la chromatine sur l’expression.

L’après-midi s’est terminée assez tôt car nous devions nous rendre à la soirée de gala. Une visite de la ville avait été prévue avant la soirée en petit train ou en bateau-mouche. La soirée de gala elle-même s’est déroulée à deux endroits différents. Initialement prévue au conseil de l’Europe pour tous les participants, un second endroit a du être trouvé à cause de l’affluence d’inscriptions tardives.

Quelques photos de la soirée de gala

IMG_0494
IMG_0498

Mercredi

Et c’est avec un réveil un peu difficile que nous avons attaqué la dernière journée.

La première présentation de la journée par Doron Lancet traitait des liens entre gènes et maladies. Une belle présentation qui a donné le ton de la journée. Nous avons en effet eu le droit a beaucoup de présentations sur les liens entre des données issues de bases de données diverses, comme des annotations, des données d’expression, les ontologies, etc… Nous avons pu sentir un vrai besoin d’unifier les données qui existent déjà. Nous avons pu également découvrir des outils de prédictions des ontologies plus ou moins performants.

L’après-midi a débuté par deux conférences consacrées à la fouille de données. Les outils de text mining sont encore peu utilisés mais permettent de fournir des informations intéressantes. Notamment ils ont permis d'identifier les principaux outils, programmes ou bases de données utilisés en bioinformatique. Etonnamment, BLAST reste le programme le plus couramment utilisé et cité dans les publications. La dernière session était consacrée à la prédiction d’ARN avec des outils comme CRISPRstrand.

Enfin la cérémonie de remises des prix à clôturé l’ECCB en nous donnant rendez-vous l’an prochain à Dublin.
IMG_0546

Bilan

Pour faire un bilan un peu plus personnel de ces quelques jours, je dirais que c’est tout d’abord un vrai plaisir de rencontrer beaucoup de bioinformaticiens d’horizons très divers et de voir la très grande variété de domaines dans lesquels notre discipline joue un rôle majeur. En revanche, j’ai été un peu déçu par la qualité des intervenants et des présentations, principalement à cause de la faible part de la bioinformatique par rapport aux résultats scientifiques. J’aurais aimé en apprendre un peu plus sur les développements des outils, des algorithmes et sur les difficultés rencontrées. Globalement, j’ai plutôt bien apprécié l’organisation mais les problèmes récurrents de wifi, les timing très serrés pour les repas ou les sessions poster et la déception de la soirée de gala ont un peu terni mon enthousiasme.

Les problèmes de wifi ont d’ailleurs été un frein à la présence de l’ECCB sur les réseaux sociaux, et en particulier twitter. Malgré cela quelques twittos (dont bioinfo-fr) ont quand même pu faire vivre en direct les conférences avec 150 à 200 tweets par jour.
nb_tweets_par_jour_with_RT
nb_tweets_par_user_withRT

On pourra regretter au passage le faible nombre de tweets du compte officiel @eccb14, alors que la présidente du comité d’organisation nous avait incité lors de l’ouverture à faire vivre le congrès un maximum sur les réseaux sociaux.

Pour finir, les présentations de text mining m’ont donné envie d'utiliser ces techniques pour identifier les mots les plus tweetés lors de cet ECCB. Le résultat est loin d'être parfait car je ne suis pas un spécialiste du domaine mais c'est finalement assez simple d'extraire les mots les plus fréquents à l'aide du package R "wordcloud".

On peut constater que le mot le plus tweeté est « data », ce qui n’a rien d’étonnant, les données étant vraiment au coeur de notre métier. On peut d’ailleurs confirmer cela en recherchant les mots fréquents dans les titres des conférences et des posters.

Mots les plus fréquents dans les tweets

mots_frequents_tweets

Mots les plus fréquents dans les posters

mots_frequents_posters

Mots les plus fréquents dans les titres des conférences

mots_frequents_titres

Un bilan mitigé pour cette édition de l'ECCB mais malgré tout positif grâce aux nombreuses rencontres que j'ai pu y faire (et au mug de l'EBI). J'ai hâte de me rendre à Dublin l'année prochaine.

Goodies de l'EBI

IMG_0444

Retrouvez les bilan des précédentes éditions de l'ECCB en 2012 (bioinfo-fr.net/eccb-le-bilan) et 2013 (bioinfo-fr.net/jobim2013-le-bilan)
Merci aux relecteurs Yoann M, Bu et Guillaume Collet pour avoir pris le temps de corriger les très nombreuses fautes (pardon !) et pour leurs suggestions qui ont grandement améliorer cet article.

  • À propos de
  • Après une thèse de biochimie et un post-doc en chimiométrie pendant lesquels j'avais développé un certain nombre d'outils informatiques, j'ai décidé de sauter le pas et de devenir un bioinformaticien à part entière. A la suite d'une formation de bioinfo dispensée par l'institut Pasteur, j'ai intégré ce dernier comme bioinformaticien dans une unité de recherche sur l'ARN. Mon activité se répartie entre traitement et analyse de données d'une part et développement d'outils de bioinfo d'autre part.

Laisser un commentaire