Les 8 et 9 février dernier ont eu lieu à l'Université de Montpellier (UM) les 4e Montpellier OMICS Days (MODs). Un événement en deux temps : le premier jour était consacré aux conférences et le deuxième jour à 2 workshops un débutant sur la prise en main de l'environnement GNU/Linux et un avancé sur l'analyse des données de NGS.
MODs 2016 : Analyse des données de séquençage à haut-débit (NGS) : Génomique, transcriptomique et analyses statistiques
L'initiative date de la création du Master STIC (devenu SNS). Alban Mancheron, alors responsable du parcours BCD du Master STIC Santé (maintenant Master Sciences et Numérique pour la Santé), a proposé dans le cadre de l'UE "Omiques" de faire organiser un événement avec des intervenants extérieurs. Ce sont les étudiants de la première édition qui ont ensuite trouvé le nom et la forme que prennent aujourd'hui les MODs. Depuis quatre ans chaque promotion organise deux jours de conférences et workshops. Tout est à leur charge : trouver le thème, les partenaires financiers, les intervenants et bien sûr la communication, notamment en créant un nouveau site web chaque année.
L'UE n'est plus obligatoire, mais les étudiants restent motivés et ont pris les choses en main, allant même jusqu'à monter une association pour supporter le projet et également créer un réseau de contacts pour les futurs étudiants.
Les conférences du premier jour étaient réparties en plusieurs thèmes. En voici les grandes lignes.
Séquençage de longues lectures : Stefan Engelen (Genoscope, Paris) et Eric Rivals (LIRMM, Montpellier)
Les séquenceurs de troisième génération (minION, PacBio) produisent des lectures de plusieurs kilo-bases, pouvant même atteindre les 100kb, mais avec une qualité moindre (taux d’erreurs ~15%) en comparaison avec les lectures courtes produites par les technologies de seconde génération (50–300bp, taux d’erreurs <1%).
Les logiciels présentés NaS tool (Engelen S.) et LoRDEC (Rivals E.) tirent avantage des deux générations. Ils utilisent les lectures courtes de bonne qualité pour compenser la mauvaise qualité des lectures longues. Les séquences obtenues après assemblage peuvent couvrir plusieurs méga-bases avec une qualité approchant les 100%. Cela ouvre beaucoup de perspectives pour les années à venir et le nombre de génomes séquencés.
Analyse et traitement des NGS : Jérôme Audoux (IRMB, Montpellier)
Pour simplifier l’analyse de données de NGS, deux outils de benchmark ont été développés par l’équipe de Jérôme Audoux : simCT et BenchCT.
SimCT simule des séquençages ADN. Les erreurs produites par le séquençage sont paramétrables pour coller au plus près aux données réelles.
BenchCT, en utilisant les données simulées, compare les sorties de votre pipeline d’analyse NGS aux résultats attendus (mapping, SNP calling…) et produit un rapport qui vous permettra d’évaluer si les logiciels et les paramètres choisis sont adaptés à votre expérience.
Genome-Wide ASsociation (GWAS)
Evolution de l’offre dans le domaine des puces ADN : Philippe Lavisse (Affymetrix)
Philippe Lavisse a mis en avant le besoin en bioinformaticiens à de nombreuses étapes du développement de leurs technologies et les collaborations avec les chercheurs afin de créer des puces personnalisées, répondant à des problématiques précises.
Projet Medigene : Florin Grigorescu (IRD, Montpellier)
Les puces ADN conventionnelles, utilisées pour l’étude des GWAS, contiennent des milliers de marqueurs de SNP (Single Nucleotide Polymorphism – polymorphisme d’un nucléotide) répartis sur l’ensemble du génome. L’innovation du projet a été de concevoir, en collaboration avec Affymetrix, une puce contenant les marqueurs pour plusieurs milliers de SNPs mais associés à seulement une dizaine de gènes. Le résultat permet de savoir où est née une personne, autour de la Méditerranée, avec une précision surprenante. Ce type de puces permettra d’identifier la susceptibilité à certaines maladies en fonction du phénotype et de l’ancestralité des populations.
Sélection de fruit assistée par marqueur ADN :
Christopher Sauvage (GAFL, Avignon)
Christopher Sauvage est parti du constat que les sélections faites sur les tomates depuis plusieurs décennies/siècles ont toujours privilégié la conservation et la grosseur du fruit au détriment d’autres qualités comme la teneur en sucre et en vitamine C.
Il a utilisé les puces ADN et l’analyse de GWAS pour identifier les marqueurs responsables de traits physiologiques des tomates. Il a pu ainsi identifier quelque dizaines de marqueurs ayant une influence sur le métabolisme des tomates et pouvant être suivis lors de la sélection, afin d’améliorer le fruit (Sauvage et al Plant physiology 2014).
Métagénomique
Estimation du gradient de dégression de la densité de l’herbier de Zostère : Catherine Breton (ISEM, Montpellier)
Deux sites ont été choisis pour cette étude, le bassin d’Arcachon et celui de Thau. Sur chaque site, de nombreux prélèvements par carottage du sol ont été faits. En comparant la composition en ADN 18s et 16s, l’équipe de recherche a mis en relation l’évolution de la composition du sol et la disparition des herbiers.
E‑science
E‑biogenouest : Yvan Le Bras ( IRISA-INRIA, Rennes)
Chaque équipe de recherche au début de son premier projet NGS va regarder ses besoins en matériel informatique et s’équiper en machines coûteuses et bien souvent difficiles à maintenir. Elle va également chercher les logiciels qu’il lui faut et parfois réinventer la roue.
Constatant que la recherche est normalement un domaine de partage où chaque équipe bénéficie des avancées des autres, Yvan Le Bras s’est lancé le défi de faire de la bioinformatique avec un minimum de matériel informatique et en bénéficiant au maximum de l’expérience des autres. Pour cela son équipe a créé un environnement virtuel de recherche (VRE), basé sur HUBZero, une plateforme pour la collaboration scientifique. eBGOs sert autant à l’analyse de données avec un accès à une plateforme Galaxy, qu’au partage de connaissances avec des tutoriels (textes,vidéos…) ou des articles de type blog.
Sur la plate-forme vous pouvez créer et gérer vos projets, les rendre publics ou les partager seulement avec vos collaborateurs, faire des analyses sur vos résultats et les mettre en forme pour une présentation. L’idée est forte : avoir un endroit où vous connecter et avoir tout à disposition pour mener un projet scientifique.
Cette journée de conférence a été bien remplie et je n’ai pu donner qu’un aperçu, pour chaque intervenant, des sujets abordés. J’espère que je n’ai pas été trop loin dans la simplification des enjeux des différentes présentations et que vous aurez envie d’en savoir plus. J’ai essayé de mettre le maximum de liens, n’hésitez pas à cliquer pour avoir plus d’information sur les projets présentés.
Merci aux organisateurs des MOD2016 pour cette superbe journée et aussi d’avoir pris le temps de répondre à mes questions, et à l’année prochaine très certainement… enfin pas vous… si tout va bien l’équipe aura changé ;).
Laisser un commentaire