Découverte :
Retour d'expérience : bonnes pratiques à appliquer en cas de déréférencement Google (et autres)

Avertissement : cet article déroge exceptionnellement à la ligne éditoriale que nous nous sommes imposées depuis le début de l'aventure. Nous n'allons pas parler de bioinformatique de près ou de loin dans cet article. Quoique les plus enthousiastes d'entre vous pourraient dire que cela peut arriver à une application web bioinfo 🙂

 
Mise en bouche
Nous avons malheureusement, et à notre grande surprise, vécu récemment un déréférencement inattendu de tous les plus gros moteurs de recherche connus et reconnus : Google, Duckduckgo, Yahoo, Bing, Lycos, ...

Didacticiel :
Vous ne savez pas comment analyser vos données Hi-C? Exemple d'utilisation de HiC-pro

Partir de quelconques données de séquençage haut débit brutes pour arriver à une analyse complète demande au mieux, une certaine pratique de ces technologies. Dans bien des cas, on va alors mettre en place un pipeline reposant sur tout un tas d'outils. Il faudra probablement des heures pour comprendre les paramètres de chacun d’entre eux et regrouper l'ensemble en une jolie chaine de traitement pour arriver au résultat souhaité (qui restera bien sûr à interpréter hum...

Didacticiel :
Packrat ou comment gérer ses packages R par projet

Qui ne s'est jamais retrouvé coincé entre deux projets R utilisant deux versions différentes d'un même package ?
Qui n'a jamais eu cette idée folle, un jour d'inventer un cas d'école (via R) qu'il souhaitait partager ?
Qui n'a jamais eu à chercher quelle version de package est nécessaire avec un code récupéré d'un collègue pour qu'il fonctionne comme celui du dit collègue ?
Qui n'a jamais installé nombre de packages dans sa librairie pour divers projets et n'a jamais osé les désinstaller par peur que des projets ne fonctionnent plus ?
Qui n'a jamais mis à jour un package dans un projet pour qu'il fonctionne, et ainsi cessé de faire fonctionner un autre projet ?
Qui n'a jamais mis à jour par erreur un package et involontairement TOUTES ses dépendances avec la même conséquence que ci-dessus ?

 
Je vais m'arrêter là, je pense que vous avez compris que la gestion de packages sous R est une source d'erreurs faciles...

Astuce :
Comment fixer les problèmes de déploiement et de durabilité des outils en bioinformatique ? Indice : conda !

La diversité des questions que se posent nos amis biologistes entraîne une diversité des données : génomiques, images, etc. De plus, ces données sont générées à des vitesses folles. Pour manipuler les données et extraire les informations utiles, des solutions et outils bioinformatiques sont nécessaires. De nombreux outils existent déjà pour répondre à de nombreuses questions. Mais parfois, de nouveaux outils sont nécessaires pour répondre à une question spécifique...

Découverte :
Conda le meilleur ami du bioinformaticien

Conda, le meilleur ami du bioinformaticien

Conda est un package manager écrit en python, comme pypi. Mais contrairement à celui-ci, il permet d'installer des programmes écrits dans d'autres langages. Notamment vos outils bioinformatiques préférés par l’intermédiaire du dépôt bioconda. C'est-à-dire que tous vos outils, que ce soit samtools, bwa, bowtie, trimmomatic, fastqc et j'en passe, sont disponibles et mis à jour par l’intermédiaire de conda...

Actualité :
Petit panel des journées bioinformatiques organisées par les masters en France!

En collaboration avec JeBiF et dans le cadre des bioinformations , nous mettons aujourd'hui des initiatives locales de masters à l'honneur ! Plusieurs masters ont, petit à petit, structuré leurs activités et créé des journées dédiées à la bioinformatique.
Nous partagerons (sans modération 😉 ) les retours que nous ont fournis 3 villes : Rennes, Montpellier et Bordeaux. Chacun de ces articles est la version complète de ceux proposés dans les bioinformations du mois de mars prochain, qui, pour des raisons éditoriales, ne permettent pas de restituer l'intégralité de ces retranscriptions...

Découverte :
Tour d'horizon des outils de visualisation des réseaux biologiques

Après les différentes méthodes d'analyse et de représentation de réseaux métaboliques biologiques, je vais vous parler des différents outils de visualisation.  Car oui, la visualisation d'un réseau ou de ses sous-parties peut être le début de son analyse, car elle permet de se rendre compte de sa topologie, de sa complexité, sa connectivité...

En biologie, on peut mettre sous la forme d'un réseau à peu près n'importe quel type de données à condition qu'elles présentent des relations entre elles...

Brèves :
Dessiner vos gènes à partir d'un GFF3

Je découvre à l'instant genometools, un outil multifonction qui est capable de générer une image représentant des annotations sur un génome de référence. Idéal par exemple, si vous voulez vous passer d'un genome browser comme UCSC ou Ensembl pour incruster des images dans votre rapport.
Installation
Vous pouvez récupérer et compiler le code source depuis le site officiel. Pour ma part j'ai directement récupéré le binaire après un échec de compilation...

Didacticiel :
LaTeX : les flottants !

Chose promise, chose due dans le précédent article voilà les flottants dans LaTeX
Les flottants sont l'ensemble des éléments qui perturbent le flot du texte (pour faire simple) et désignent classiquement les tables et les figures ;on peut définir des environnements custom de flottants, mais on y reviendra dans un autre article ;).
Les flottants « nagent » dans le texte, et vont se positionner là où il faut pour que la lecture soit fluide...

Suivez l'guide :
dplyr et le génome humain

Introduction
Non, ne fuyez pas tout de suite, chers lecteurs, tout va s'éclaircir : dplyr, c’est plyr pour les data.frame (les tableaux de données). Attendez, j’y viens, plyr, c’est un package R pour appliquer (apply) des fonctions. Donc, dplyr (prononcez “diplir”), c’est un package R, pour appliquer des fonctions à un tableau de données.
Et ça, mes amis, c'est super cool.
Rendez-vous service : imprimez immédiatement cette feuille d’astuces le concernant (pdf, 0...