Astuce :
Organiser une conférence en ligne : trucs et astuces

Télétravail et visioconférence, notre nouveau quotidien (source: pixabay)

Organiser une conférence est complexe. Mais organiser une conférence en ligne... c'est TRÈS complexe. Si l'ordinateur qui diffuse la conférence plante... comment prévenir l'audience ? La moindre erreur technique fait d'avantage peur car il devient plus difficile de rebondir et d’expliquer l'issue à la 'salle'...

Astuce :
Créer des Heatmaps à partir de grosses matrices en R

En génomique, et sans doute dans tout un tas d'autres domaines omiques ou big data, nous essayons souvent de tracer des grosses matrices sous forme d'heatmap. Par grosse matrice, j'entends une matrice dont le nombre de lignes et/ou de colonnes est plus grand que le nombre de pixels sur l'écran que vous utilisez. Par exemples, si vous avez une matrice de 50 colonnes et de 20 000 lignes (cas assez fréquent quand il y a une ligne par gène), il y a de forte chances que cette matrice aura plus de lignes qu'il n'y a de pixels sur votre écran -- 1080 pixels verticaux sur un écran HD (à moins bien sûr que vous lisiez ceci dans un futur lointain d'hyper haute définition)...

Astuce :
Trouver un emploi/une thèse en bioinformatique : quelques pistes [maj]

Job Search (Nick Youngson CC BY-SA 3.0 Alpha Stock Images)

Comme le disait Estel en 2012, trouver un job en bioinfo n'est pas évident. Contrairement à certains métiers qui concentrent l'entièreté des offres d'emploi de leur pays en une seule plateforme, les emplois de bioinfo sont distribuées aléatoirement entre des dizaines de sites d'annonces plus ou moins spécifiques à la bioinformatique...

Astuce :
Customiser matplotlib (faire son matplotlibrc)

Suite à une mésaventure liée à matplotlib sur le chan IRC #bioinfo-fr (mésaventure suite aux fameuses erreurs de display ; si vous voulez tout savoir : si on configure mal son matplotlib on peut générer des erreurs qui font qu'on obtient des images vides… voir la partie sur le backend plus tard :o), j'ai parlé de la joie qu'est d'avoir un matplotlibrc et à quel point ça simplifie la vie...

Astuce :
Maîtrisez le cache de Rmarkdown !

Pour des raisons de reproduction de la science, il est important de conserver une trace de tout ce que l'on fait sur son ordinateur. Pour cela, faire des rapports est la meilleure manière que je connaisse qui permette d'inclure le code et les résultats d'une analyse. Pour faire ça bien avec R, on a déjà vu dans un article précédant que les rapports Rmarkdown étaient une très bonne solution...

Astuce :
Représenter rapidement une ACP avec R et ggplot2

Je ne sais pas pour vous, mais moi, à chaque fois que j'assiste à une réunion de labo, il y a quasi systématiquement un graphique d'ACP pour montrer les données. Et à chaque fois, il s'agit d'un graphique de base, généré avec R, avec la fonction plot(), des couleurs qui piquent les yeux et des axes et légendes illisibles. La critique est facile me direz-vous, j'avoue avoir moi aussi présenté ce genre de graphique assez souvent...

Astuce :
Comment fixer les problèmes de déploiement et de durabilité des outils en bioinformatique ? Indice : conda !

La diversité des questions que se posent nos amis biologistes entraîne une diversité des données : génomiques, images, etc. De plus, ces données sont générées à des vitesses folles. Pour manipuler les données et extraire les informations utiles, des solutions et outils bioinformatiques sont nécessaires. De nombreux outils existent déjà pour répondre à de nombreuses questions. Mais parfois, de nouveaux outils sont nécessaires pour répondre à une question spécifique...

Astuce :
S'outiller et s'organiser pour mieux travailler

TL;DR La reproductibilité, c’est la vie (dans le monde scientifique) ! Tout résultat doit pouvoir être reproduit. La technologie permet de faciliter la recherche de reproductibilité. Les cahiers de laboratoire papiers ne sont plus du tout adaptés à la recherche actuelle et au besoin de reproductibilité. Je préconise donc d’utiliser git et GitHub, de bien organiser ses projets et d’utiliser des cahiers de laboratoire électroniques...

Astuce :
C'est l'enfeR.

Certains bio-informaticiens ne jurent que par R (j'en fais partie). Je suis amoureux de sa simplicité (sic), son élégance (re-sic), sa documentation et ses innombrables packages tous plus utiles les uns que les autres. Et surtout c'est le seul langage que je maîtrise un peu convenablement, alors forcément je trouve tous les autres langages nuls, en toute objectivité.
Et pourtant R est universellement reconnu comme étant un langage de programmation ésotérique...

Astuce :
Snakemake pour les nuls (ou comment créer un pipeline facilement ?)

Bonjour à tous, et bienvenue dans le premier épisode d'une (longue ?) série de prise en main de l'outil dédié au pipeline : Snakemake.
Si vous ne connaissez pas encore cet outil, c'est que vous êtes sûrement passés à côté de cet article écrit par Nisaea. Alors, quel sera les bénéfices de retranscrire vos pipelines déjà tout prêt en Snakefile ?
Lisibilité du code, gestion des ressources et reproductibilité
Snake | Crystal Sanchez
Lorsque vous êtes sur le point de publier,  il va bien falloir expliquer aux futurs lecteurs comment vous avez obtenu les résultats...