Découverte :
Eh toi ! rev_comp, tu l'écris comment ?

Écrire un algorithme de rev_comp ou complément inverse, on l'a tous déjà fait. Aujourd'hui c'est devenu un classique des cours d'algorithmique en étude de bioinformatique, c'est un algorithme simple mais qui demande de savoir utiliser les structures de contrôle de base. À la fois un bon exercice pratique et pédagogique, doit-il cependant rester implémenté comme à nos débuts ? Cette question m'a traversé l'esprit durant un cours où mon implémentation et celles de mes camarades étaient toutes différentes avec à chaque fois différents algorithmes de base...

Découverte :
Retour d'expérience : bonnes pratiques à appliquer en cas de déréférencement Google (et autres)

Avertissement : cet article déroge exceptionnellement à la ligne éditoriale que nous nous sommes imposées depuis le début de l'aventure. Nous n'allons pas parler de bioinformatique de près ou de loin dans cet article. Quoique les plus enthousiastes d'entre vous pourraient dire que cela peut arriver à une application web bioinfo 🙂

 
Mise en bouche
Nous avons malheureusement, et à notre grande surprise, vécu récemment un déréférencement inattendu de tous les plus gros moteurs de recherche connus et reconnus : Google, Duckduckgo, Yahoo, Bing, Lycos, ...

Astuce :
Comment fixer les problèmes de déploiement et de durabilité des outils en bioinformatique ? Indice : conda !

La diversité des questions que se posent nos amis biologistes entraîne une diversité des données : génomiques, images, etc. De plus, ces données sont générées à des vitesses folles. Pour manipuler les données et extraire les informations utiles, des solutions et outils bioinformatiques sont nécessaires. De nombreux outils existent déjà pour répondre à de nombreuses questions. Mais parfois, de nouveaux outils sont nécessaires pour répondre à une question spécifique...

Découverte :
Conda le meilleur ami du bioinformaticien

Conda, le meilleur ami du bioinformaticien

Conda est un package manager écrit en python, comme pypi. Mais contrairement à celui-ci, il permet d'installer des programmes écrits dans d'autres langages. Notamment vos outils bioinformatiques préférés par l’intermédiaire du dépôt bioconda. C'est-à-dire que tous vos outils, que ce soit samtools, bwa, bowtie, trimmomatic, fastqc et j'en passe, sont disponibles et mis à jour par l’intermédiaire de conda...

Découverte :
Tour d'horizon des outils de visualisation des réseaux biologiques

Après les différentes méthodes d'analyse et de représentation de réseaux métaboliques biologiques, je vais vous parler des différents outils de visualisation.  Car oui, la visualisation d'un réseau ou de ses sous-parties peut être le début de son analyse, car elle permet de se rendre compte de sa topologie, de sa complexité, sa connectivité...

En biologie, on peut mettre sous la forme d'un réseau à peu près n'importe quel type de données à condition qu'elles présentent des relations entre elles...

Brèves :
Dessiner vos gènes à partir d'un GFF3

Je découvre à l'instant genometools, un outil multifonction qui est capable de générer une image représentant des annotations sur un génome de référence. Idéal par exemple, si vous voulez vous passer d'un genome browser comme UCSC ou Ensembl pour incruster des images dans votre rapport.
Installation
Vous pouvez récupérer et compiler le code source depuis le site officiel. Pour ma part j'ai directement récupéré le binaire après un échec de compilation...

Découverte :
La magie de LXD

Écrire un pipeline en bioinformatique, c'est bien ! Le rendre portable c'est encore mieux ! Les bioinformaticiens oublient souvent ce dernier point et rare sont les pipelines qui marchent du premier coup. À vrai dire les circonstances ne sont pas en leur faveur. Un pipeline c'est plein de dépendances d'applications dans telle ou telle version, qu'il faut souvent compiler à la main. Sans oublier les différentes versions de langages comme Python 2 et Python 3...

Découverte :
Nextflow, pour votre prochain pipeline ?

Pour commencer
Vous savez déjà tout sur les pipelines et les bonnes pratiques de développement. Vous faites bien évidemment de la recherche reproductive. Vous travaillez peut-être avec un cluster. Vous avez écrit votre propre pipeline en Bash, Python ou même en Perl qui gérait les appels à différents scripts et outils (voire même l'appel à l'ordonnanceur). Vous développez un pipeline, ou le maintenez...

Découverte :
Rust, un super héros au secours de la bio-informatique ?

 
Rust est la traduction du mot "rouille" en anglais, ainsi qu'un jeu vidéo de survie post-apocalyptique, mais c'est aussi un langage de programmation. Et vous devez maintenant vous demander :
Encore un autre langage, mais pourquoi ?
Les origines
En 2006 Graydon Hoare, un développeur chez Mozilla, commence un projet personnel, un nouveau langage de programmation qu'il va nommer Rust. Trois ans plus tard, le langage est jugé suffisamment mature pour intéresser Mozilla, qui décide de le prendre sous son aile...

Découverte :
Promiscuité enzymatique, ou comment gérer l'annotation des enzymes

N'importe quel bioinformaticien, débutant ou confirmé, s'est confronté au moins une fois dans sa vie à ce problème : l'annotation d'une séquence. Vous me direz, faciiiiiile ! Il y a désormais des tonnes d'outils qui permettent, très rapidement en plus, de trouver une fonction pour une séquence ! Alors, déjà, il y a BLAST, InterPro, Pfam, PRIAM, HMMER, ... et bien d'autres ! Puis il y a tellement de séquences déjà annotées dans des bases de données manuellement curées comme SwissProt que l'annotation fonctionnelle n'est plus vraiment un problème !
Bon, vous vous doutez bien que si on écrit un article sur l'annotation fonctionnelle sur ce blog, c'est que tout n'est pas aussi simple...