Archives par tags: programmation

Astuce :
L'annotation de régions génomiques et les analyses d’enrichissement

Non il ne s'agit pas d'enrichissement d'uranium ! (U.S. Department of Energy, Domaine Public)
Les annotations sont essentielles lors d'analyses fonctionnelles à large échelle sur le génome. 
Lorsque l’on pratique des analyses en génomique, basées sur des techniques comme le RNA-seq ou le ChIP-seq, on se retrouve avec respectivement une liste de transcrits ou de pics (régions génomiques)...

Découverte :
Cython: votre programme Python mais 100x plus vite

Python est un langage extrêmement pratique car il est facile à lire et à écrire, comparé à un langage de "bas niveau" et compilé comme le C. D'un autre côté, à l'exécution il est beaucoup plus lent. C'est un compromis entre les deux qu'offre Cython, permettant d'accélérer votre programme d'un facteur 2 à plus de 100, et d'intégrer facilement des fonctions déjà écrites en C - d'où son nom...

Astuce :
The Bio Code : guide du bon broinformaticien

Malgré la multitude d’outils déjà existants, les occasions d'écrire du code sont nombreuses en bioinformatique. Hormis pour les pousse-boutons avertis, le développement fait souvent partie du quotidien d’un bioinformaticien. Personnellement, c’est une activité qui me plaît beaucoup dans ce métier. Développer ses propres applications et outils apporte toujours une certaine satisfaction (et quand ça fonctionne, c’est encore mieux !)...

Didacticiel :
Parser des fichiers HTML en Python

I can haz HTML (CC-BY Tomomi)
Langage : Python
Bibliothèques : bioservices, HTMLParser, re (partiellement)
Niveau : débutant-intermédiaire
Dans un article précédent, je vous ai présenté le module bioservices en Python. Au cours de mon travail j'ai été amenée à récupérer des informations sur les termes Gene Ontology, et notamment sur les relations entre différents termes. Cependant, les formats de fichiers récupérés sont différents en fonction des données qu'ils renferment...

Découverte :
Julia: le successeur de R ?

Logo du langage Julia.Source: http://julialang.org/
Actuellement le langage R est incontournable pour qui veut manipuler des données en bioinformatique, en particulier pour l'analyse statistique. Mais un successeur est en passe de s'imposer : Julia, combinant puissance du langage avec les fonctionnalités de R, et comblant les nombreux défauts de ce dernier - mais plus encore ! Voici une présentation de ce tout nouveau langage...

Découverte :
Jouez avec vos données : utilisez un ORM

Il y a quelques temps, je vous ai parlé de base de données, un super moyen pour structurer vos données.
Vous êtes maintenant j'en suis sûr, des professionnels du SELECT, des JOIN et autres ALTER. C'est bien, très bien même, mais maintenant je vais vous apprendre à vous en passer. Et oui, la ligne de commande c'est sympa pour des choses simples et/ou rapides, mais dès que vous voulez plus de complexité, il devient difficile de travailler sans un langage de plus haut niveau...

Opinion :
Lâchez vos coms!

Je souhaiterais partager avec vous dans ce billet quelques petites choses qui relèvent plus de l'anecdote personnelle que de l'article sérieux. J'espère que vous ne m'en voudrez pas si je prends le risque de baisser un peu le niveau de ce blog, mais ça fait un moment que le sujet me trottait en tête.
En Python, les commentaires commencent par un dièse
Les commentaires sont nos amis, il faut les aimer aussi
Il y a quelques temps, j'ai eu un petit débat de fin de journée avec un collègue qui a un bagage très informatique...

Découverte :
ROSALIND : devenez le meilleur bioinformaticien du monde

Logo de rosalind.info
ROSALIND est un nouveau site web commençant à se faire un nom dans le milieu de la bioinformatique. C'est une plateforme permettant d’apprendre la bioinformatique de manière ludique en donnant des problèmes a résoudre.
Chez bioinfo-fr on aime bien et on a trouvé judicieux de vous le présenter afin que vous puissiez vous en faire votre propre avis. Bonne découverte !
V...

Astuce :
Astuce : ajouter des options dans un script Bash avec getopt

But : comprendre le fonctionnement de getopt en Bash pour éviter la multiplications de script là où un seul générique pourrait suffire.
Prérequis : savoir faire des scripts Bash, connaître la substitution de commande et savoir manipuler les arguments.
Difficulté : 2 (moyen)
Pour ceux qui codent en Perl, vous connaissez déjà sûrement le module GetOpt et plus particulièrement son extension GetOpt::Long (ou encore le module getopt du langage Python)...

Découverte :
Bioconductor

Bioconductor
Voilà le sujet que l'on va aborder ensemble aujourd'hui. On va voir ce que c'est, à quoi cela sert, comment l'installer et bien-sûr l'utiliser.
Qu'est-ce donc ?
Je décrirais Bioconductor comme un projet participatif. Il est libre d'accès et son développement dépend de ce que la communauté veut bien y apporter. L'objectif est simple, offrir aux biologistes, un ensemble de programmes pour l'analyse de données, faciles à mettre en place et à utiliser...