Astuce :
Customiser matplotlib (faire son matplotlibrc)

Suite à une mésaventure liée à matplotlib sur le chan IRC #bioinfo-fr (mésaventure suite aux fameuses erreurs de display ; si vous voulez tout savoir : si on configure mal son matplotlib on peut générer des erreurs qui font qu'on obtient des images vides… voir la partie sur le backend plus tard :o), j'ai parlé de la joie qu'est d'avoir un matplotlibrc et à quel point ça simplifie la vie...

Astuce :
Maîtrisez le cache de Rmarkdown !

Pour des raisons de reproduction de la science, il est important de conserver une trace de tout ce que l'on fait sur son ordinateur. Pour cela, faire des rapports est la meilleure manière que je connaisse qui permette d'inclure le code et les résultats d'une analyse. Pour faire ça bien avec R, on a déjà vu dans un article précédant que les rapports Rmarkdown étaient une très bonne solution...

Astuce :
Représenter rapidement une ACP avec R et ggplot2

Je ne sais pas pour vous, mais moi, à chaque fois que j'assiste à une réunion de labo, il y a quasi systématiquement un graphique d'ACP pour montrer les données. Et à chaque fois, il s'agit d'un graphique de base, généré avec R, avec la fonction plot(), des couleurs qui piquent les yeux et des axes et légendes illisibles. La critique est facile me direz-vous, j'avoue avoir moi aussi présenté ce genre de graphique assez souvent...

Astuce :
Comment fixer les problèmes de déploiement et de durabilité des outils en bioinformatique ? Indice : conda !

La diversité des questions que se posent nos amis biologistes entraîne une diversité des données : génomiques, images, etc. De plus, ces données sont générées à des vitesses folles. Pour manipuler les données et extraire les informations utiles, des solutions et outils bioinformatiques sont nécessaires. De nombreux outils existent déjà pour répondre à de nombreuses questions. Mais parfois, de nouveaux outils sont nécessaires pour répondre à une question spécifique...

Astuce :
S'outiller et s'organiser pour mieux travailler

TL;DR La reproductibilité, c’est la vie (dans le monde scientifique) ! Tout résultat doit pouvoir être reproduit. La technologie permet de faciliter la recherche de reproductibilité. Les cahiers de laboratoire papiers ne sont plus du tout adaptés à la recherche actuelle et au besoin de reproductibilité. Je préconise donc d’utiliser git et GitHub, de bien organiser ses projets et d’utiliser des cahiers de laboratoire électroniques...

Astuce :
C'est l'enfeR.

Certains bio-informaticiens ne jurent que par R (j'en fais partie). Je suis amoureux de sa simplicité (sic), son élégance (re-sic), sa documentation et ses innombrables packages tous plus utiles les uns que les autres. Et surtout c'est le seul langage que je maîtrise un peu convenablement, alors forcément je trouve tous les autres langages nuls, en toute objectivité.
Et pourtant R est universellement reconnu comme étant un langage de programmation ésotérique...

Astuce :
Snakemake pour les nuls (ou comment créer un pipeline facilement ?)

Bonjour à tous, et bienvenue dans le premier épisode d'une (longue ?) série de prise en main de l'outil dédié au pipeline : Snakemake.
Si vous ne connaissez pas encore cet outil, c'est que vous êtes sûrement passés à côté de cet article écrit par Nisaea. Alors, quel sera les bénéfices de retranscrire vos pipelines déjà tout prêt en Snakefile ?
Lisibilité du code, gestion des ressources et reproductibilité

Lorsque vous êtes sur le point de publier,  il va bien falloir expliquer aux futurs lecteurs comment vous avez obtenu les résultats...

Astuce :
Inkscape : l'outil idéal pour vos figures et posters

Je sais pas pour vous mais dans mon labo, le premier réflexe de mes collègues lorsqu'il faut faire une figure ou un poster c'est soit de dégainer la suite Ad*be, soit d'ouvrir P*werPoint. Quel est le problème me direz-vous ? Outre le fait qu'ils soient très coûteux pour le labo/l'université/l'entreprise où vous travaillez, ces outils ne sont pas forcément adaptés à l'usage que vous en faites...

Astuce :
Créer sa carte géographique avec R

Aujourd’hui je vais vous montrer comment, en utilisant R, on peut faire de belles cartes géographiques.
Et là, vous allez me demander, mais pourquoi faire des cartes géographique ? Et pourquoi avec R ?
Et bien imaginons que, vous, bioinformaticien de terrain, soyez allé échantillonner des animaux à l’autre bout du monde sur plusieurs sites, par exemple des Marsupilami (totalement au hasard !)...

Astuce :
L'annotation de régions génomiques et les analyses d’enrichissement

Les annotations sont essentielles lors d'analyses fonctionnelles à large échelle sur le génome. 
Lorsque l’on pratique des analyses en génomique, basées sur des techniques comme le RNA-seq ou le ChIP-seq, on se retrouve avec respectivement une liste de transcrits ou de pics (régions génomiques). Dans le cas des analyses ChIP-seq, on souhaite caractériser les gènes cibles du facteur de transcription étudié sur tout le génome (genome-wide), pour comprendre la fonction biologique de ce facteur...