Archives par tags: analyse

Didacticiel :
Analyse de réseaux : du degré des noeuds aux centralités

Le deuxième article sur la représentation du métabolisme et son analyse!
Pour rappel, le premier volet est ici!

Un grand nombre de phénomènes biologiques peuvent être représentés sous la forme d'un réseau. Qui n'a jamais entendu parler de réseaux d'intéraction protéine-protéine (fameux réseaux "PPI"), de réseaux de gènes ou encore de réseaux métaboliques? En fait, dès qu'il s'agit de représenter des connexions ou des intéractions entre des entités, que ce soit en biologie ou dans un autre domaine...

Didacticiel :
De la procrastination dans l'R

Connaissances requises

Connaissances basiques en R. Si vous ne faites pas la différence entre un test exact de Fisher et le test du Chi-2, cela ne devrait pas poser de problème.
Euh, bah c'est tout !

Introduction
Si l'on s'en réfère à la définition :
Un informaticien, et a fortiori un bioinformaticien, fera tout pour mettre en œuvre des stratégies lui permettant d'automatiser les tâches répétitives qui lui incombe...

Astuce :
L'annotation de régions génomiques et les analyses d’enrichissement

Les annotations sont essentielles lors d'analyses fonctionnelles à large échelle sur le génome. 
Lorsque l’on pratique des analyses en génomique, basées sur des techniques comme le RNA-seq ou le ChIP-seq, on se retrouve avec respectivement une liste de transcrits ou de pics (régions génomiques). Dans le cas des analyses ChIP-seq, on souhaite caractériser les gènes cibles du facteur de transcription étudié sur tout le génome (genome-wide), pour comprendre la fonction biologique de ce facteur...

Découverte :
L'analyse en composantes principales (avec R)

L'ACP, ou Analyse en Composantes Principales, est une méthode d'exploration de données qui consiste à réduire la dimensionnalité du problème pour en extraire l'essentiel. Par une projection dans un espace plus petit, on réduit le nombre de variables, et si on réduit suffisamment on peut en faire un outil de diagnostic graphique. Comme c'est une projection, il est important de comprendre qu'on perd de l'information dans le processus, mais cela permet d'interpréter plus facilement les données...

Découverte :
Flux Balance Analysis ou la simulation du métabolisme d'une cellule

"I thought there couldn't be anything as complicated as the universe, until I started reading about the cell.“
(Systems Biologist Eric de Silva -astrophysicist by training-, Imperial College London.)

Avec l'arrivée des technologies de séquençage à haut débit (NGS pour les intimes), de plus en plus de génomes complets sont disponibles dans les banques de données publiques ou non. A partir de ces génomes, on peut faire de la reconstruction automatisée de réseaux métaboliques à l'échelle de l'organisme (ou presque)...

Découverte :
Julia: le successeur de R ?

Actuellement le langage R est incontournable pour qui veut manipuler des données en bioinformatique, en particulier pour l'analyse statistique. Mais un successeur est en passe de s'imposer : Julia, combinant puissance du langage avec les fonctionnalités de R, et comblant les nombreux défauts de ce dernier - mais plus encore ! Voici une présentation de ce tout nouveau langage.
 
À l'origine
La principale raison du succès de R est le système de "packages" qui a permis à chaque labo d'écrire et de rendre facilement récupérable le code qui résout son problème particulier...

Astuce :
Analyses rapides de fichiers

Langage : shell, sous GNU/Linux
Commandes présentées : wc, awk, sed, tr, head, nl, cut
Niveau : débutant
Dans le cadre de notre travail, nous sommes souvent amenés à manipuler de nombreux fichiers contenant des milliers de lignes et des dizaines de champs. Dans ces cas-là, nous avons souvent tendance à virer à la paranoïa et à vouloir nous assurer que nos fichiers sont bien formatés et contiennent bien le nombre de lignes, champs ou éléments attendus...

Suivez l'guide :
Tests Statistiques : suivez l'guide

Introduction : Pourquoi des tests statistiques ?

Les tests statistiques sont de puissants outils d’aide à la décision pour le chercheur, qui lui permettent de vérifier des hypothèses expérimentales, avec un certain seuil de probabilité. Ces tests sont simples à appliquer, mais parfois moins simples à comprendre. C’est pourquoi nous allons étudier ensemble ces tests pas à pas afin que vous puissiez comprendre quel test utiliser pour vos données, comment l’appliquer et comment utiliser ces résultats...

Découverte :
L'analyse de données RNA-seq: mode d'emploi

Un jour, un biologiste se pointe chez vous avec d'une part un disque dur externe dans la main, d'autre part l'air soucieux. Il veut que vous analysiez ses données RNA-seq. Le disque, c'est parce qu'il a environ 50Gb de données à vous transmettre; l'air soucieux, c'est parce qu'elles ont coûté dans les 15'000 euros, et qu'il espère que pour une fois il a pas trop foiré ses manips. Il compte sur vous, vu qu'il n'a aucune idée de ce qu'il a entre les mains, mais il veut des p-valeurs en sortie, et des petites, s'il vous plaît...

Découverte :
Bioconductor

Bioconductor
Voilà le sujet que l'on va aborder ensemble aujourd'hui. On va voir ce que c'est, à quoi cela sert, comment l'installer et bien-sûr l'utiliser.
Qu'est-ce donc ?
Je décrirais Bioconductor comme un projet participatif. Il est libre d'accès et son développement dépend de ce que la communauté veut bien y apporter. L'objectif est simple, offrir aux biologistes, un ensemble de programmes pour l'analyse de données, faciles à mettre en place et à utiliser...