Archives par tags: UCSC

Didacticiel :
Les éléments répétés du génome humain : aperçu rapide avec R et le tidyverse

Dans un précédent article, nous avions regardé le fichier d'annotation des gènes du génome humain d’après Gencode. J'avais utilisé pour cela la puissante combinaison dplyr + ggplot2 (packages centraux du tidyverse), particulièrement adaptée à tout ce qui est manipulation et visualisation de données tabulaires.
Mais notre génome n'est pas constitué que de gènes, loin s'en faut ! Les éléments répétés sont en fait bien plus majoritaires...

Astuce :
Fabriquer un trackhub dans UCSC

J'ai décidé de partager avec vous la petite astuce du moment que j'ai découverte grâce à Jonathan et que j'ai incorporée dans mon travail actuel (merci encore à lui, il a lu toute l’infâme documentation de UCSC).
[edit : Il vient d'ailleurs de me signaler que la documentation pour les trackhubs vient d'être mise à jour et est devenue beaucoup plus digeste. Tant mieux pour les suivants.]
Le navigateur génomique (pour ne pas dire genome browser) de UCSC nous autorise donc à générer et visualiser des "trackhubs"...

Découverte :
L'analyse de données RNA-seq: mode d'emploi

Un jour, un biologiste se pointe chez vous avec d'une part un disque dur externe dans la main, d'autre part l'air soucieux. Il veut que vous analysiez ses données RNA-seq. Le disque, c'est parce qu'il a environ 50Gb de données à vous transmettre; l'air soucieux, c'est parce qu'elles ont coûté dans les 15'000 euros, et qu'il espère que pour une fois il a pas trop foiré ses manips. Il compte sur vous, vu qu'il n'a aucune idée de ce qu'il a entre les mains, mais il veut des p-valeurs en sortie, et des petites, s'il vous plaît...