Didacticiel :
"IRC ? Mais c'est quoi en fait ?"

Cette question, je l'entends maintenant depuis pas mal de temps quand je parle du blog à mon entourage (étudiants de mon ex-master, personnes rencontrées aux JeBiF Pubs et TOBi, collègues, bioinformaticiens croisés, etc.). C'en est arrivé au point que je me sens vieille je me suis dit que faire un article de présentation de cet outil qu'est IRC, adjoint d'un mini tutoriel serait une bonne idée...

Découverte :
Eh toi ! rev_comp, tu l'écris comment ?

Écrire un algorithme de rev_comp ou complément inverse, on l'a tous déjà fait. Aujourd'hui c'est devenu un classique des cours d'algorithmique en étude de bioinformatique, c'est un algorithme simple mais qui demande de savoir utiliser les structures de contrôle de base. À la fois un bon exercice pratique et pédagogique, doit-il cependant rester implémenté comme à nos débuts ? Cette question m'a traversé l'esprit durant un cours où mon implémentation et celles de mes camarades étaient toutes différentes avec à chaque fois différents algorithmes de base...

Didacticiel :
Vous ne savez pas comment analyser vos données Hi-C? Exemple d'utilisation de HiC-pro

Partir de quelconques données de séquençage haut débit brutes pour arriver à une analyse complète demande au mieux, une certaine pratique de ces technologies. Dans bien des cas, on va alors mettre en place un pipeline reposant sur tout un tas d'outils. Il faudra probablement des heures pour comprendre les paramètres de chacun d’entre eux et regrouper l'ensemble en une jolie chaine de traitement pour arriver au résultat souhaité (qui restera bien sûr à interpréter hum...

Didacticiel :
Packrat ou comment gérer ses packages R par projet

Qui ne s'est jamais retrouvé coincé entre deux projets R utilisant deux versions différentes d'un même package ?
Qui n'a jamais eu cette idée folle, un jour d'inventer un cas d'école (via R) qu'il souhaitait partager ?
Qui n'a jamais eu à chercher quelle version de package est nécessaire avec un code récupéré d'un collègue pour qu'il fonctionne comme celui du dit collègue ?
Qui n'a jamais installé nombre de packages dans sa librairie pour divers projets et n'a jamais osé les désinstaller par peur que des projets ne fonctionnent plus ?
Qui n'a jamais mis à jour un package dans un projet pour qu'il fonctionne, et ainsi cessé de faire fonctionner un autre projet ?
Qui n'a jamais mis à jour par erreur un package et involontairement TOUTES ses dépendances avec la même conséquence que ci-dessus ?

 
Je vais m'arrêter là, je pense que vous avez compris que la gestion de packages sous R est une source d'erreurs faciles...

Didacticiel :
LaTeX : les flottants !

Chose promise, chose due dans le précédent article voilà les flottants dans LaTeX
Les flottants sont l'ensemble des éléments qui perturbent le flot du texte (pour faire simple) et désignent classiquement les tables et les figures ;on peut définir des environnements custom de flottants, mais on y reviendra dans un autre article ;).
Les flottants « nagent » dans le texte, et vont se positionner là où il faut pour que la lecture soit fluide...

Découverte :
La magie de LXD

Écrire un pipeline en bioinformatique, c'est bien ! Le rendre portable c'est encore mieux ! Les bioinformaticiens oublient souvent ce dernier point et rare sont les pipelines qui marchent du premier coup. À vrai dire les circonstances ne sont pas en leur faveur. Un pipeline c'est plein de dépendances d'applications dans telle ou telle version, qu'il faut souvent compiler à la main. Sans oublier les différentes versions de langages comme Python 2 et Python 3...

Didacticiel :
LaTeX : le premier document !

On s'est rendu compte sur #bioinfo-fr et sur #jebif (les canaux IRC sur freenode) qu'au cours des rédactions de rapports de stage ou même de thèse on avait plein de questions portant sur LaTeX et on a décidé qu'on allait se fendre de quelques articles sur LaTeX pour avoir une suite de liens appropriés à donner pour répondre aux questions. 🙂
Alors voilà le premier article, très basique, qui reprend tout (presque) au début pour prendre de bonnes habitudes...

Didacticiel :
Automatiser la récupération de données biologiques : version avancée

Dans cette version avancée, nous allons nous intéresser à une autre manière de récupérer des données depuis un site internet : via l'utilisation de formulaires.
Les formulaires, ce sont ces pages avec plein de champs à remplir et que vous soumettez ensuite pour vous créer un compte, contacter votre hotline ou que sais-je. Leur utilisation permet de contourner une limitation importante de la soumission d'informations via des adresses internet (ou URL pour "Uniform Resource Locator") : le volume de données (au fait, saviez-vous qu'un Geek ne crie pas, mais qu'il URL? ;-))...

Didacticiel :
Ce qu'il faut voir sur une carte de contact chromosomique

Vous ne connaissez pas le Hi-C ? Avant de commencer cette lecture, peut être vous faut-il la base, précédemment expliquée (maladroitement certes, premier article oblige) sur cet autre article.
 
Sur la fin de mon stage de Master 2, j'ai eu la joie de revenir faire un tour dans les cartes de contacts chromosomiques (Hi-C) pour diverses raisons. Par amusement (on va le dire ainsi), j'ai joué avec les échelles de couleur afin d’étudier l'impact sur les images obtenues...

Astuce :
C'est l'enfeR.

Certains bio-informaticiens ne jurent que par R (j'en fais partie). Je suis amoureux de sa simplicité (sic), son élégance (re-sic), sa documentation et ses innombrables packages tous plus utiles les uns que les autres. Et surtout c'est le seul langage que je maîtrise un peu convenablement, alors forcément je trouve tous les autres langages nuls, en toute objectivité.
Et pourtant R est universellement reconnu comme étant un langage de programmation ésotérique...