Archives par tags: R

Didacticiel :
Cours de R pour débutant pressé : les régressions !

Bonjour à tous et soyez les bienvenus dans ce 3ème cours de R pour débutant pressé.
Aujourd’hui, nous allons voir rapidement ce qu’est une régression (linéaire ou quadratique), à quoi ça sert et ce que ça peut nous apprendre sur nos données.
Ne vous êtes-vous jamais demandé comment en apprendre plus sur vos données, comment savoir quel paramètre est le plus important ou plus simplement s’il est possible « de faire une belle ligne sur mon graphique » ?
Non ? Ah… et bien merci à bientôt...

Découverte :
Twitter, arme de communication massive et outil scientifique

CC-BY Jonathan Sobel
Twitter est un réseau social incontournable. Son principe est simple, il s'agit de s'échanger avec ses "followers", des messages ou "tweets" de 140 charactères maximum. Il est surtout utilisé aux Etats-Unis, mais la fièvre Twitter gagne peu à peu l'Europe.  De nombreux scientifiques, chefs de labos, doctorants et même des institutions informent par ce biais. En créant votre compte vous pourrez avoir un accès direct à toutes ces personnes (en tant que suiveur) et vous pourrez leur poser des questions au moyen de messages directs (DM)...

Actualité :
La bière décodée dans un Hackuarium

CC-BY Jonathan Sobel/ Hackuarium
Vous aimez la bière et la science ? Vous voulez connaître la composition de votre mousse favorite ? Vous avez envie de goûter de nouvelles bières proches de celles que vous connaissez, ou complètement différentes ?
Il y a quelques temps déjà, je vous ai décrit la place de la bioinformatique dans les laboratoires citoyens. Aujourd'hui, un projet sympathique de séquençage et d’analyse biochimique voit le jour à Renens (Suisse, VD)...

Astuce :
Créer sa carte géographique avec R

Aujourd’hui je vais vous montrer comment, en utilisant R, on peut faire de belles cartes géographiques.
Et là, vous allez me demander, mais pourquoi faire des cartes géographique ? Et pourquoi avec R ?
Et bien imaginons que, vous, bioinformaticien de terrain, soyez allé échantillonner des animaux à l’autre bout du monde sur plusieurs sites, par exemple des Marsupilami (totalement au hasard !)...

Didacticiel :
De la procrastination dans l'R

Connaissances requises

Connaissances basiques en R. Si vous ne faites pas la différence entre un test exact de Fisher et le test du Chi-2, cela ne devrait pas poser de problème.
Euh, bah c'est tout !

Introduction
Si l'on s'en réfère à la définition :
Un informaticien, et a fortiori un bioinformaticien, fera tout pour mettre en œuvre des stratégies lui permettant d'automatiser les tâches répétitives qui lui incombe...

Astuce :
L'annotation de régions génomiques et les analyses d’enrichissement

Non il ne s'agit pas d'enrichissement d'uranium ! (U.S. Department of Energy, Domaine Public)
Les annotations sont essentielles lors d'analyses fonctionnelles à large échelle sur le génome. 
Lorsque l’on pratique des analyses en génomique, basées sur des techniques comme le RNA-seq ou le ChIP-seq, on se retrouve avec respectivement une liste de transcrits ou de pics (régions génomiques)...

Découverte :
L'analyse en composantes principales (avec R)

L'ACP, ou Analyse en Composantes Principales, est une méthode d'exploration de données qui consiste à réduire la dimensionnalité du problème pour en extraire l'essentiel. Par une projection dans un espace plus petit, on réduit le nombre de variables, et si on réduit suffisamment on peut en faire un outil de diagnostic graphique. Comme c'est une projection, il est important de comprendre qu'on perd de l'information dans le processus, mais cela permet d'interpréter plus facilement les données...

Suivez l'guide :
Guide de démarrage pour ggplot2, un package graphique pour R

Hadley Wickham signed his book "ggplot2" in my iPad | H. Okumura
Le traitement et l’analyse de données sont une part importante des tâches demandées à un bioinformaticien. L’utilisation de R facilite grandement la manipulation des données et permet également leur représentation de multiples façons. Malgré le potentiel de R, ce dernier est souvent sous-exploité à cause d’une syntaxe parfois trop complexe...

Didacticiel :
Les mélanges gaussiens

Un boa qui a mangé trois éléphants.
La plupart des mesures que l'on obtient des expériences en biologie suivent approximativement une distribution dite "normale", ou "gaussienne", dont la densité a la forme d'une cloche, symétrique avec un unique sommet au milieu. C'est aussi l'hypothèse d'un grand nombre d'outils d'analyse statistique. Mais que faire quand on observe deux sommets ou plus ? Le plus probable, c'est qu'on observe alors un mélange de plusieurs composantes normales, qu'on voudrait séparer...