Didacticiel :
Les éléments répétés du génome humain : aperçu rapide avec R et le tidyverse

Dans un précédent article, nous avions regardé le fichier d'annotation des gènes du génome humain d’après Gencode. J'avais utilisé pour cela la puissante combinaison dplyr + ggplot2 (packages centraux du tidyverse), particulièrement adaptée à tout ce qui est manipulation et visualisation de données tabulaires.
Mais notre génome n'est pas constitué que de gènes, loin s'en faut ! Les éléments répétés sont en fait bien plus majoritaires...

Découverte :
Créez vos documents collaboratifs en LaTeX

Aujourd'hui, on vous présente une méthode pour créer vos documents collaboratifs en ligne, en utilisant LaTeX, ainsi que quelques astuces qui pourront peut-être vous simplifier la vie !
Un petit peu de contexte
Imaginons : vous êtes un jeune chercheur dynamique, et vous voulez rédiger un papier avec vos collaborateurs. Ou bien vous êtes un étudiant, et vous devez rendre un rapport quelconque à partir d'un travail fait en groupe...

Didacticiel :
Pimp my workstation: avoir le terminal le plus classe du bureau !

Mise en place de zsh et d'un dossier .dotfiles

 
Introduction
Qu'est-ce que c'est que zsh ?
Il s'agit (comme nous indique aimablement sa page Wikipédia) d'un shell unix. En gros, il s'agit d'un remplaçant potentiel pour votre vénérable interpréteur bash.
Mais pourquoi se casser le beignet à installer zsh, alors que j'ai déjà bash ?
zsh a plusieurs atouts sur bash :
- Une autocomplétion avancée (incluant une correction orthographique)...

Astuce :
Représenter rapidement une ACP avec R et ggplot2

Je ne sais pas pour vous, mais moi, à chaque fois que j'assiste à une réunion de labo, il y a quasi systématiquement un graphique d'ACP pour montrer les données. Et à chaque fois, il s'agit d'un graphique de base, généré avec R, avec la fonction plot(), des couleurs qui piquent les yeux et des axes et légendes illisibles. La critique est facile me direz-vous, j'avoue avoir moi aussi présenté ce genre de graphique assez souvent...

Didacticiel :
"IRC ? Mais c'est quoi en fait ?"

Cette question, je l'entends maintenant depuis pas mal de temps quand je parle du blog à mon entourage (étudiants de mon ex-master, personnes rencontrées aux JeBiF Pubs et TOBi, collègues, bioinformaticiens croisés, etc.). C'en est arrivé au point que je me sens vieille je me suis dit que faire un article de présentation de cet outil qu'est IRC, adjoint d'un mini tutoriel serait une bonne idée...

Découverte :
Eh toi ! rev_comp, tu l'écris comment ?

Écrire un algorithme de rev_comp ou complément inverse, on l'a tous déjà fait. Aujourd'hui c'est devenu un classique des cours d'algorithmique en étude de bioinformatique, c'est un algorithme simple mais qui demande de savoir utiliser les structures de contrôle de base. À la fois un bon exercice pratique et pédagogique, doit-il cependant rester implémenté comme à nos débuts ? Cette question m'a traversé l'esprit durant un cours où mon implémentation et celles de mes camarades étaient toutes différentes avec à chaque fois différents algorithmes de base...

Didacticiel :
Vous ne savez pas comment analyser vos données Hi-C? Exemple d'utilisation de HiC-pro

Partir de quelconques données de séquençage haut débit brutes pour arriver à une analyse complète demande au mieux, une certaine pratique de ces technologies. Dans bien des cas, on va alors mettre en place un pipeline reposant sur tout un tas d'outils. Il faudra probablement des heures pour comprendre les paramètres de chacun d’entre eux et regrouper l'ensemble en une jolie chaine de traitement pour arriver au résultat souhaité (qui restera bien sûr à interpréter hum...

Didacticiel :
Packrat ou comment gérer ses packages R par projet

Qui ne s'est jamais retrouvé coincé entre deux projets R utilisant deux versions différentes d'un même package ?
Qui n'a jamais eu cette idée folle, un jour d'inventer un cas d'école (via R) qu'il souhaitait partager ?
Qui n'a jamais eu à chercher quelle version de package est nécessaire avec un code récupéré d'un collègue pour qu'il fonctionne comme celui du dit collègue ?
Qui n'a jamais installé nombre de packages dans sa librairie pour divers projets et n'a jamais osé les désinstaller par peur que des projets ne fonctionnent plus ?
Qui n'a jamais mis à jour un package dans un projet pour qu'il fonctionne, et ainsi cessé de faire fonctionner un autre projet ?
Qui n'a jamais mis à jour par erreur un package et involontairement TOUTES ses dépendances avec la même conséquence que ci-dessus ?

 
Je vais m'arrêter là, je pense que vous avez compris que la gestion de packages sous R est une source d'erreurs faciles...

Didacticiel :
LaTeX : les flottants !

Chose promise, chose due dans le précédent article voilà les flottants dans LaTeX
Les flottants sont l'ensemble des éléments qui perturbent le flot du texte (pour faire simple) et désignent classiquement les tables et les figures ;on peut définir des environnements custom de flottants, mais on y reviendra dans un autre article ;).
Les flottants « nagent » dans le texte, et vont se positionner là où il faut pour que la lecture soit fluide...

Découverte :
La magie de LXD

Écrire un pipeline en bioinformatique, c'est bien ! Le rendre portable c'est encore mieux ! Les bioinformaticiens oublient souvent ce dernier point et rare sont les pipelines qui marchent du premier coup. À vrai dire les circonstances ne sont pas en leur faveur. Un pipeline c'est plein de dépendances d'applications dans telle ou telle version, qu'il faut souvent compiler à la main. Sans oublier les différentes versions de langages comme Python 2 et Python 3...