ECCB'14 à Strasbourg — le bilan

ECCB'14

eccb_banner_green
La confé­rence ECCB 2014 s’est dérou­lée cette année du 7 au 10 sep­tembre 2014 à Stras­bourg. Elle était cou­plée avec JOBIM et donc co-orga­ni­sée par la SFBI. La confé­rence était pré­cé­dée par 2 jour­nées de work­shops et tuto­riels.

Le pro­gramme com­plet est acces­sible à l’adresse sui­vante : www​.eccb14​.org

Les work­shops et tuto­riels en marge de la confé­rence se sont dérou­lés à la facul­té de méde­cine de Stras­bourg. Dans une ambiance bon enfant, on a pu assis­ter à des ate­liers très ciblés tels que l’analyse des iso­formes par RNA-seq ou les approches infor­ma­tique du dichroïsme cir­cu­laire et à des tuto­riels sur des outils comme bio­JS ou Galaxy.

La confé­rence a réel­le­ment débu­té le dimanche soir avec en invi­té d’honneur comme pre­mier ora­teur Jean-Marie Lehn. Bien qu’assez loin de la bio­in­for­ma­tique, sa pré­sen­ta­tion de struc­tures chi­miques arti­fi­cielles s’auto-arrangeant en double-hélice était extrê­me­ment inté­res­sante. Le cock­tail qui a sui­vi a été l’occasion de ren­con­trer pour la pre­mière fois la qua­si-tota­li­té des par­ti­ci­pants et de consta­ter l’importance du congrès puisque près de 1100 per­sonnes étaient pré­sentes.

Lundi

Le lun­di matin, la pre­mière confé­rence était une key­note de Patrick Aloy sur les stra­té­gies thé­ra­peu­tiques uti­li­sant les réseaux méta­bo­liques. Cette pré­sen­ta­tion a été la pre­mière d’une longue série trai­tant du croi­se­ment de don­nées externes avec des don­nées médi­cales. Nous nous sommes ensuite répar­tis en deux groupes, cer­tains ont sui­vi les ses­sions sur les réseaux méta­bo­liques et d’autres sur la géno­mique des popu­la­tions.
La ses­sion « réseaux méta­bo­liques » a démar­ré par la pré­sen­ta­tion de « HubA­li­gn », un outil d’alignement de pro­téines impli­quées dans un réseau. L’outil est très effi­cace car il tire par­ti de la séquence des pro­téines et de ses inter­ac­tions avec les autres pro­téines. La pré­sen­ta­tion sui­vante a trai­té du même sujet. L’outil pré­sen­té (Net­dis) était, cela dit, bien moins convain­cant. Ensuite, nous avons assis­té à une pré­sen­ta­tion sur la ran­do­mi­sa­tion des grands sets de don­nées. La ran­do­mi­sa­tion des sets de don­nées est néces­saire pour extraire des modèles com­bi­na­toires de don­nées géno­miques de can­cer. BeRe­wire a été déve­lop­pé dans ce but et est dis­po­nible comme package R dans Bio­con­duc­tor.

Après la pause, la ses­sion sur le séquen­çage et l’analyse des génomes a débu­té. Le pre­mier outil pré­sen­té, « lamb­da » per­met l’alignement local de don­nées en grand volume. La vitesse de l’outil pour ali­gner des séquences est très impres­sion­nante… com­pa­rée à un BLAST. En revanche, face à des outils plus récents, il est dif­fi­cile de dire si il y a vrai­ment un avan­tage sans le tes­ter. On nous a pré­sen­té ensuite « FIONA », un pro­gramme per­met­tant de cor­ri­ger les erreurs de lec­tures des séquen­ceurs. La stra­té­gie se base sur la fré­quence d’apparition des erreurs à une posi­tion don­née. Il y a besoin d’une cou­ver­ture suf­fi­sam­ment éle­vée pour que cette méthode soit effi­cace mais elle per­met d’améliorer un peu les assem­blages. Durant la der­nière confé­rence de la mati­née, on nous a pré­sen­té une com­pa­rai­son d’algorithmes d’alignement de séquences pro­ve­nant de séquen­ceurs Ion Tor­rent. L’objet de la pré­sen­ta­tion était sur­tout de nous mon­trer deux outils, « CuRe­Sim » et « CuRe­Si­mE­val » per­met­tant res­pec­ti­ve­ment de simu­ler des reads et d’évaluer les résul­tats d’alignement par dif­fé­rents algo­rithmes. Des outils qui peuvent se mon­trer très utiles fina­le­ment.

Nous sommes pas­sé ensuite au repas, avec le défi de faire déjeu­ner plus de 1000 per­sonnes en une petite heure. Mal­gré ce timing très ser­ré, il faut avouer qu’il n’y a pas eu de pro­blème de ce coté, même si on aurait appré­cié d’avoir un peu plus de temps pour conti­nuer les dis­cus­sions enta­mées pen­dant les déjeu­ners.

L’après-midi a débu­té par la deuxième par­tie de la ses­sion séquen­çage. Au pro­gramme deux outils de recherche d’haplotypes (Fas­tHap et prob­Hap) et un de détec­tion de CNV (cnvOff­Seq). N’étant pas un spé­cia­liste du domaine, j’aurais du mal à émettre un avis sur ces outils, sur­tout dans le cas des halo­types. cnvOff­Seq m’a paru très per­for­mant et mérite d’être tes­té.

IMG_0430

La der­nière ses­sion de ce lun­di était consa­crée à nou­veau aux réseaux méta­bo­liques. Une pre­mière confé­rence expli­quait une méthode d’identification de fac­teurs de trans­crip­tion. L’algorithme DACO a sem­blé assez effi­cace. Ensuite nous avons écou­té une pré­sen­ta­tion sur l’identification de réseaux méta­bo­liques modi­fiés dans les cel­lules can­cé­reuses. Et enfin nous avons ter­mi­né la ses­sion par un sémi­naire sur les miR­NA et leur lien avec les réseaux méta­bo­liques. Cette der­nière confé­rence était très ins­truc­tive et j’ai pu apprendre beau­coup de chose sur les miR­NAs.

IMG_0431

La jour­née s’est ter­mi­née par la ses­sion pos­ters. 500 pos­ters que je ne résu­me­rai pas mais qui étaient pour beau­coup d’entre eux de très bonne qua­li­té. Contrai­re­ment aux confé­rences qui s’attardaient très peu fina­le­ment sur l’aspect bio­in­for­ma­tique du tra­vail pour lais­ser plus de place à l’aspect bio­lo­gique des résul­tats, les pos­ters met­taient plus en avant le coté infor­ma­tique et n’hésitaient pas à mon­trer des algo­rithmes ce qui fait tou­jours plai­sir. Le seul regret est que 2 heures, c’est un peu court pour tout voir mais les pos­ters res­tant affi­chés pen­dant trois jours, on peut tou­jours y reve­nir un peu plus tard.

Mardi

La jour­née du mar­di a débu­té par une pré­sen­ta­tion sur les avan­cées en data mining. Au final assez peu d’information dans cette key­note sinon quelques outils comme KNIME, utile pour le data mining. Ensuite dans le cadre de la ses­sion sur la décou­verte d’information bio­lo­gique dans les don­nées, nous avons assis­té à trois confé­rences. La pre­mière sur la recherche d’information en croi­sant des don­nées de cribles chi­miques. Confé­rence très inté­res­sante même si le sujet était loin de mes pré­oc­cu­pa­tions. La deuxième confé­rence était tout aus­si inté­res­sante et trai­tait de la recherche de l’espace occu­pé par des com­po­sés chi­miques uti­li­sés dans la lutte contre le can­cer. Il était inté­res­sant de consta­ter que des molé­cules avec des com­po­si­tions et des struc­tures dif­fé­rentes peuvent fina­le­ment occu­per le même espace et agir ain­si de la même manière comme inhi­bi­teur d'enzyme par exemple. La der­nière, sur les inter­ac­tions des molé­cules bio­ac­tives, était en revanche un peu moins pas­sion­nante.

Après la pause, s’est dérou­lée la ses­sion sur l’expression des gènes qui a duré jusqu’à la fin de la jour­née. Nous avons com­men­cé par une confé­rence sur l’expression des fac­teurs de trans­crip­tion puis nous avons enchai­né sur une jolie uti­li­sa­tion des chaines de Mar­kov pour la modé­li­sa­tion de la dyna­mique de méthy­la­tion de l’ADN.
Après le repas Ewan Bir­ney, direc­teur de l’EBI a fait une pré­sen­ta­tion sur les « big data ». On a pu voir à cette occa­sion l’impressionnante infra­struc­ture de l’EBI ain­si qu’une pré­sen­ta­tion d’un nou­veau mode de sto­ckage d’information sur un sup­port peu com­mun, l’ADN. Ce pro­cé­dé, encore à ses débuts, est un peu lent en écri­ture car la syn­thèse d’une molé­cule d’ADN avec l’information sou­hai­tée prend du temps, mais est très rapide en lec­ture et sur­tout en copie.
L’après-midi s’est pour­sui­vi par la fin de la ses­sion sur l’expression des gènes, avec notam­ment une pré­sen­ta­tion sur la seg­men­ta­tion des HiC et sur l’influence de la posi­tion de la chro­ma­tine sur l’expression.

L’après-midi s’est ter­mi­née assez tôt car nous devions nous rendre à la soi­rée de gala. Une visite de la ville avait été pré­vue avant la soi­rée en petit train ou en bateau-mouche. La soi­rée de gala elle-même s’est dérou­lée à deux endroits dif­fé­rents. Ini­tia­le­ment pré­vue au conseil de l’Europe pour tous les par­ti­ci­pants, un second endroit a du être trou­vé à cause de l’affluence d’inscriptions tar­dives.

Quelques photos de la soirée de gala

IMG_0494
IMG_0498

Mercredi

Et c’est avec un réveil un peu dif­fi­cile que nous avons atta­qué la der­nière jour­née.

La pre­mière pré­sen­ta­tion de la jour­née par Doron Lan­cet trai­tait des liens entre gènes et mala­dies. Une belle pré­sen­ta­tion qui a don­né le ton de la jour­née. Nous avons en effet eu le droit a beau­coup de pré­sen­ta­tions sur les liens entre des don­nées issues de bases de don­nées diverses, comme des anno­ta­tions, des don­nées d’expression, les onto­lo­gies, etc… Nous avons pu sen­tir un vrai besoin d’unifier les don­nées qui existent déjà. Nous avons pu éga­le­ment décou­vrir des outils de pré­dic­tions des onto­lo­gies plus ou moins per­for­mants.

L’après-midi a débu­té par deux confé­rences consa­crées à la fouille de don­nées. Les outils de text mining sont encore peu uti­li­sés mais per­mettent de four­nir des infor­ma­tions inté­res­santes. Notam­ment ils ont per­mis d'identifier les prin­ci­paux outils, pro­grammes ou bases de don­nées uti­li­sés en bio­in­for­ma­tique. Eton­nam­ment, BLAST reste le pro­gramme le plus cou­ram­ment uti­li­sé et cité dans les publi­ca­tions. La der­nière ses­sion était consa­crée à la pré­dic­tion d’ARN avec des outils comme CRIS­PRs­trand.

Enfin la céré­mo­nie de remises des prix à clô­tu­ré l’ECCB en nous don­nant ren­dez-vous l’an pro­chain à Dublin.
IMG_0546

Bilan

Pour faire un bilan un peu plus per­son­nel de ces quelques jours, je dirais que c’est tout d’abord un vrai plai­sir de ren­con­trer beau­coup de bio­in­for­ma­ti­ciens d’horizons très divers et de voir la très grande varié­té de domaines dans les­quels notre dis­ci­pline joue un rôle majeur. En revanche, j’ai été un peu déçu par la qua­li­té des inter­ve­nants et des pré­sen­ta­tions, prin­ci­pa­le­ment à cause de la faible part de la bio­in­for­ma­tique par rap­port aux résul­tats scien­ti­fiques. J’aurais aimé en apprendre un peu plus sur les déve­lop­pe­ments des outils, des algo­rithmes et sur les dif­fi­cul­tés ren­con­trées. Glo­ba­le­ment, j’ai plu­tôt bien appré­cié l’organisation mais les pro­blèmes récur­rents de wifi, les timing très ser­rés pour les repas ou les ses­sions pos­ter et la décep­tion de la soi­rée de gala ont un peu ter­ni mon enthou­siasme.

Les pro­blèmes de wifi ont d’ailleurs été un frein à la pré­sence de l’ECCB sur les réseaux sociaux, et en par­ti­cu­lier twit­ter. Mal­gré cela quelques twit­tos (dont bioin­fo-fr) ont quand même pu faire vivre en direct les confé­rences avec 150 à 200 tweets par jour.
nb_tweets_par_jour_with_RT
nb_tweets_par_user_withRT

On pour­ra regret­ter au pas­sage le faible nombre de tweets du compte offi­ciel @eccb14, alors que la pré­si­dente du comi­té d’organisation nous avait inci­té lors de l’ouverture à faire vivre le congrès un maxi­mum sur les réseaux sociaux.

Pour finir, les pré­sen­ta­tions de text mining m’ont don­né envie d'utiliser ces tech­niques pour iden­ti­fier les mots les plus twee­tés lors de cet ECCB. Le résul­tat est loin d'être par­fait car je ne suis pas un spé­cia­liste du domaine mais c'est fina­le­ment assez simple d'extraire les mots les plus fré­quents à l'aide du package R "word­cloud".

On peut consta­ter que le mot le plus twee­té est « data », ce qui n’a rien d’étonnant, les don­nées étant vrai­ment au coeur de notre métier. On peut d’ailleurs confir­mer cela en recher­chant les mots fré­quents dans les titres des confé­rences et des pos­ters.

Mots les plus fréquents dans les tweets

mots_frequents_tweets

Mots les plus fréquents dans les posters

mots_frequents_posters

Mots les plus fréquents dans les titres des conférences

mots_frequents_titres

Un bilan miti­gé pour cette édi­tion de l'ECCB mais mal­gré tout posi­tif grâce aux nom­breuses ren­contres que j'ai pu y faire (et au mug de l'EBI). J'ai hâte de me rendre à Dublin l'année pro­chaine.

Goodies de l'EBI

IMG_0444

Retrou­vez les bilan des pré­cé­dentes édi­tions de l'ECCB en 2012 (bioin​fo​-fr​.net/​e​c​c​b​-​l​e​-​b​i​lan) et 2013 (bioin​fo​-fr​.net/​j​o​b​i​m​2​0​1​3​-​l​e​-​b​i​lan)
Mer­ci aux relec­teurs Yoann M, Bu et Guillaume Col­let pour avoir pris le temps de cor­ri­ger les très nom­breuses fautes (par­don !) et pour leurs sug­ges­tions qui ont gran­de­ment amé­lio­rer cet article.



Pour continuer la lecture :


Commentaires

Laisser un commentaire