Archives par tags: analyse

Découverte :
ViLoVar: un outil pour la visualisation de variations génétiques

Pour mon premier article, je vais vous présenter un outil que j'ai développé lorsque je travaillais sur le projet "Myocapture"; un projet national de séquençage d'exomes qui portait sur les myopathies (https://www.afm-telethon.fr/myopathie-congenitale-6675). Ce projet visait à trouver de nouvelles mutations responsables de ces maladies rares. Il a également permis d'identifier de nouveaux gènes impliqués dans des myopathies congénitales...

Didacticiel :
Analyse de réseaux : du degré des noeuds aux centralités

Le deuxième article sur la représentation du métabolisme et son analyse!
Pour rappel, le premier volet est ici!

Un grand nombre de phénomènes biologiques peuvent être représentés sous la forme d'un réseau. Qui n'a jamais entendu parler de réseaux d'intéraction protéine-protéine (fameux réseaux "PPI"), de réseaux de gènes ou encore de réseaux métaboliques? En fait, dès qu'il s'agit de représenter des connexions ou des intéractions entre des entités, que ce soit en biologie ou dans un autre domaine...

Didacticiel :
De la procrastination dans l'R

Connaissances requises

Connaissances basiques en R. Si vous ne faites pas la différence entre un test exact de Fisher et le test du Chi-2, cela ne devrait pas poser de problème.
Euh, bah c'est tout !

Introduction
Si l'on s'en réfère à la définition :
Un informaticien, et a fortiori un bioinformaticien, fera tout pour mettre en œuvre des stratégies lui permettant d'automatiser les tâches répétitives qui lui incombe...

Astuce :
L'annotation de régions génomiques et les analyses d’enrichissement

Non il ne s'agit pas d'enrichissement d'uranium ! (U.S. Department of Energy, Domaine Public)
Les annotations sont essentielles lors d'analyses fonctionnelles à large échelle sur le génome. 
Lorsque l’on pratique des analyses en génomique, basées sur des techniques comme le RNA-seq ou le ChIP-seq, on se retrouve avec respectivement une liste de transcrits ou de pics (régions génomiques)...

Découverte :
L'analyse en composantes principales (avec R)

L'ACP, ou Analyse en Composantes Principales, est une méthode d'exploration de données qui consiste à réduire la dimensionnalité du problème pour en extraire l'essentiel. Par une projection dans un espace plus petit, on réduit le nombre de variables, et si on réduit suffisamment on peut en faire un outil de diagnostic graphique. Comme c'est une projection, il est important de comprendre qu'on perd de l'information dans le processus, mais cela permet d'interpréter plus facilement les données...

Découverte :
Flux Balance Analysis ou la simulation du métabolisme d'une cellule

"I thought there couldn't be anything as complicated as the universe, until I started reading about the cell.“
(Systems Biologist Eric de Silva -astrophysicist by training-, Imperial College London.)

Image de la vidéo "The Inner Life of a Cell" http://multimedia.mcb.harvard.edu/ © 2007 The Presidents and Fellows of Harvard College.
Avec l'arrivée des technologies de séquençage à haut débit (NGS pour les intimes), de plus en plus de génomes complets sont disponibles dans les banques de données publiques ou non...

Découverte :
Julia: le successeur de R ?

Logo du langage Julia.Source: http://julialang.org/
Actuellement le langage R est incontournable pour qui veut manipuler des données en bioinformatique, en particulier pour l'analyse statistique. Mais un successeur est en passe de s'imposer : Julia, combinant puissance du langage avec les fonctionnalités de R, et comblant les nombreux défauts de ce dernier - mais plus encore ! Voici une présentation de ce tout nouveau langage...

Astuce :
Analyses rapides de fichiers

Analyse de fichiers dans le bon vieux temps ! | Creative Commons 2.0, wikimedia

Langage : shell, sous GNU/Linux
Commandes présentées : wc, awk, sed, tr, head, nl, cut
Niveau : débutant
Dans le cadre de notre travail, nous sommes souvent amenés à manipuler de nombreux fichiers contenant des milliers de lignes et des dizaines de champs. Dans ces cas-là, nous avons souvent tendance à virer à la paranoïa et à vouloir nous assurer que nos fichiers sont bien formatés et contiennent bien le nombre de lignes, champs ou éléments attendus...

Suivez l'guide :
Tests Statistiques : suivez l'guide

Introduction : Pourquoi des tests statistiques ?
Ne vous laissez pas submerger par les chiffres | Auteur Gerd Altmann licence CC0
Les tests statistiques sont de puissants outils d’aide à la décision pour le chercheur, qui lui permettent de vérifier des hypothèses expérimentales, avec un certain seuil de probabilité. Ces tests sont simples à appliquer, mais parfois moins simples à comprendre...

Découverte :
L'analyse de données RNA-seq: mode d'emploi

Un jour, un biologiste se pointe chez vous avec d'une part un disque dur externe dans la main, d'autre part l'air soucieux. Il veut que vous analysiez ses données RNA-seq. Le disque, c'est parce qu'il a environ 50Gb de données à vous transmettre; l'air soucieux, c'est parce qu'elles ont coûté dans les 15'000 euros, et qu'il espère que pour une fois il a pas trop foiré ses manips. Il compte sur vous, vu qu'il n'a aucune idée de ce qu'il a entre les mains, mais il veut des p-valeurs en sortie, et des petites, s'il vous plaît...