Étiquette : R
-
Les éléments répétés du génome humain : aperçu rapide avec R et le tidyverse
Dans un précédent article, nous avions regardé le fichier d'annotation des gènes du génome humain d’après Gencode. J'avais utilisé pour cela la puissante combinaison dplyr + ggplot2 (packages centraux du tidyverse), particulièrement adaptée à tout ce qui est manipulation et visualisation de données tabulaires. Mais notre génome n'est pas constitué que de gènes, loin s'en…
-
Représenter rapidement une ACP avec R et ggplot2
Je ne sais pas pour vous, mais moi, à chaque fois que j'assiste à une réunion de labo, il y a quasi systématiquement un graphique d'ACP pour montrer les données. Et à chaque fois, il s'agit d'un graphique de base, généré avec R, avec la fonction plot(), des couleurs qui piquent les yeux et des…
-
Packrat ou comment gérer ses packages R par projet
Qui ne s'est jamais retrouvé coincé entre deux projets R utilisant deux versions différentes d'un même package ? Qui n'a jamais eu cette idée folle, un jour d'inventer un cas d'école (via R) qu'il souhaitait partager ? Qui n'a jamais eu à chercher quelle version de package est nécessaire avec un code récupéré d'un collègue pour qu'il fonctionne comme celui…
-
dplyr et le génome humain
Introduction Non, ne fuyez pas tout de suite, chers lecteurs, tout va s'éclaircir : dplyr, c’est plyr pour les data.frame (les tableaux de données). Attendez, j’y viens, plyr, c’est un package R pour appliquer (apply) des fonctions. Donc, dplyr (prononcez “diplir”), c’est un package R, pour appliquer des fonctions à un tableau de données. Et ça,…
-
C'est l'enfeR.
Certains bio-informaticiens ne jurent que par R (j'en fais partie). Je suis amoureux de sa simplicité (sic), son élégance (re-sic), sa documentation et ses innombrables packages tous plus utiles les uns que les autres. Et surtout c'est le seul langage que je maîtrise un peu convenablement, alors forcément je trouve tous les autres langages nuls,…
-
Cours de R pour débutant pressé : les régressions !
Bonjour à tous et soyez les bienvenus dans ce 3ème cours de R pour débutant pressé. Aujourd’hui, nous allons voir rapidement ce qu’est une régression (linéaire ou quadratique), à quoi ça sert et ce que ça peut nous apprendre sur nos données. Ne vous êtes-vous jamais demandé comment en apprendre plus sur vos données, comment…
-
Twitter, arme de communication massive et outil scientifique
Twitter est un réseau social incontournable. Son principe est simple, il s'agit de s'échanger avec ses "followers", des messages ou "tweets" de 140 charactères maximum. Il est surtout utilisé aux Etats-Unis, mais la fièvre Twitter gagne peu à peu l'Europe. De nombreux scientifiques, chefs de labos, doctorants et même des institutions informent par ce biais. En créant…
-
La bière décodée dans un Hackuarium
Vous aimez la bière et la science ? Vous voulez connaître la composition de votre mousse favorite ? Vous avez envie de goûter de nouvelles bières proches de celles que vous connaissez, ou complètement différentes ? Il y a quelques temps déjà, je vous ai décrit la place de la bioinformatique dans les laboratoires citoyens. Aujourd'hui, un projet sympathique…
-
Créer sa carte géographique avec R
Aujourd’hui je vais vous montrer comment, en utilisant R, on peut faire de belles cartes géographiques. Et là, vous allez me demander, mais pourquoi faire des cartes géographique ? Et pourquoi avec R ? Et bien imaginons que, vous, bioinformaticien de terrain, soyez allé échantillonner des animaux à l’autre bout du monde sur plusieurs sites, par exemple…