Archives par tags: R

Astuce :
Représenter rapidement une ACP avec R et ggplot2

Je ne sais pas pour vous, mais moi, à chaque fois que j'assiste à une réunion de labo, il y a quasi systématiquement un graphique d'ACP pour montrer les données. Et à chaque fois, il s'agit d'un graphique de base, généré avec R, avec la fonction plot(), des couleurs qui piquent les yeux et des axes et légendes illisibles. La critique est facile me direz-vous, j'avoue avoir moi aussi présenté ce genre de graphique assez souvent...

Didacticiel :
Packrat ou comment gérer ses packages R par projet

Qui ne s'est jamais retrouvé coincé entre deux projets R utilisant deux versions différentes d'un même package ?
Qui n'a jamais eu cette idée folle, un jour d'inventer un cas d'école (via R) qu'il souhaitait partager ?
Qui n'a jamais eu à chercher quelle version de package est nécessaire avec un code récupéré d'un collègue pour qu'il fonctionne comme celui du dit collègue ?
Qui n'a jamais installé nombre de packages dans sa librairie pour divers projets et n'a jamais osé les désinstaller par peur que des projets ne fonctionnent plus ?
Qui n'a jamais mis à jour un package dans un projet pour qu'il fonctionne, et ainsi cessé de faire fonctionner un autre projet ?
Qui n'a jamais mis à jour par erreur un package et involontairement TOUTES ses dépendances avec la même conséquence que ci-dessus ?

 
Je vais m'arrêter là, je pense que vous avez compris que la gestion de packages sous R est une source d'erreurs faciles...

Suivez l'guide :
dplyr et le génome humain

Introduction
Non, ne fuyez pas tout de suite, chers lecteurs, tout va s'éclaircir : dplyr, c’est plyr pour les data.frame (les tableaux de données). Attendez, j’y viens, plyr, c’est un package R pour appliquer (apply) des fonctions. Donc, dplyr (prononcez “diplir”), c’est un package R, pour appliquer des fonctions à un tableau de données.
Et ça, mes amis, c'est super cool.
Rendez-vous service : imprimez immédiatement cette feuille d’astuces le concernant (pdf, 0...

Astuce :
C'est l'enfeR.

Certains bio-informaticiens ne jurent que par R (j'en fais partie). Je suis amoureux de sa simplicité (sic), son élégance (re-sic), sa documentation et ses innombrables packages tous plus utiles les uns que les autres. Et surtout c'est le seul langage que je maîtrise un peu convenablement, alors forcément je trouve tous les autres langages nuls, en toute objectivité.
Et pourtant R est universellement reconnu comme étant un langage de programmation ésotérique...

Didacticiel :
Cours de R pour débutant pressé : les régressions !

Bonjour à tous et soyez les bienvenus dans ce 3ème cours de R pour débutant pressé.
Aujourd’hui, nous allons voir rapidement ce qu’est une régression (linéaire ou quadratique), à quoi ça sert et ce que ça peut nous apprendre sur nos données.
Ne vous êtes-vous jamais demandé comment en apprendre plus sur vos données, comment savoir quel paramètre est le plus important ou plus simplement s’il est possible « de faire une belle ligne sur mon graphique » ?
Non ? Ah… et bien merci à bientôt...

Découverte :
Twitter, arme de communication massive et outil scientifique

Twitter est un réseau social incontournable. Son principe est simple, il s'agit de s'échanger avec ses "followers", des messages ou "tweets" de 140 charactères maximum. Il est surtout utilisé aux Etats-Unis, mais la fièvre Twitter gagne peu à peu l'Europe.  De nombreux scientifiques, chefs de labos, doctorants et même des institutions informent par ce biais. En créant votre compte vous pourrez avoir un accès direct à toutes ces personnes (en tant que suiveur) et vous pourrez leur poser des questions au moyen de messages directs (DM)...

Actualité :
La bière décodée dans un Hackuarium

Vous aimez la bière et la science ? Vous voulez connaître la composition de votre mousse favorite ? Vous avez envie de goûter de nouvelles bières proches de celles que vous connaissez, ou complètement différentes ?
Il y a quelques temps déjà, je vous ai décrit la place de la bioinformatique dans les laboratoires citoyens. Aujourd'hui, un projet sympathique de séquençage et d’analyse biochimique voit le jour à Renens (Suisse, VD)...

Astuce :
Créer sa carte géographique avec R

Aujourd’hui je vais vous montrer comment, en utilisant R, on peut faire de belles cartes géographiques.
Et là, vous allez me demander, mais pourquoi faire des cartes géographique ? Et pourquoi avec R ?
Et bien imaginons que, vous, bioinformaticien de terrain, soyez allé échantillonner des animaux à l’autre bout du monde sur plusieurs sites, par exemple des Marsupilami (totalement au hasard !)...

Didacticiel :
De la procrastination dans l'R

Connaissances requises

Connaissances basiques en R. Si vous ne faites pas la différence entre un test exact de Fisher et le test du Chi-2, cela ne devrait pas poser de problème.
Euh, bah c'est tout !

Introduction
Si l'on s'en réfère à la définition :
Un informaticien, et a fortiori un bioinformaticien, fera tout pour mettre en œuvre des stratégies lui permettant d'automatiser les tâches répétitives qui lui incombe...

Astuce :
L'annotation de régions génomiques et les analyses d’enrichissement

Les annotations sont essentielles lors d'analyses fonctionnelles à large échelle sur le génome. 
Lorsque l’on pratique des analyses en génomique, basées sur des techniques comme le RNA-seq ou le ChIP-seq, on se retrouve avec respectivement une liste de transcrits ou de pics (régions génomiques). Dans le cas des analyses ChIP-seq, on souhaite caractériser les gènes cibles du facteur de transcription étudié sur tout le génome (genome-wide), pour comprendre la fonction biologique de ce facteur...