Archives par tags: programmation

Didacticiel :
Parser des fichiers HTML en Python

Langage : Python
Bibliothèques : bioservices, HTMLParser, re (partiellement)
Niveau : débutant-intermédiaire
Dans un article précédent, je vous ai présenté le module bioservices en Python. Au cours de mon travail j'ai été amenée à récupérer des informations sur les termes Gene Ontology, et notamment sur les relations entre différents termes. Cependant, les formats de fichiers récupérés sont différents en fonction des données qu'ils renferment...

Découverte :
Julia: le successeur de R ?

Actuellement le langage R est incontournable pour qui veut manipuler des données en bioinformatique, en particulier pour l'analyse statistique. Mais un successeur est en passe de s'imposer : Julia, combinant puissance du langage avec les fonctionnalités de R, et comblant les nombreux défauts de ce dernier - mais plus encore ! Voici une présentation de ce tout nouveau langage.
 
À l'origine
La principale raison du succès de R est le système de "packages" qui a permis à chaque labo d'écrire et de rendre facilement récupérable le code qui résout son problème particulier...

Découverte :
Jouez avec vos données : utilisez un ORM

Il y a quelques temps, je vous ai parlé de base de données, un super moyen pour structurer vos données.
Vous êtes maintenant j'en suis sûr, des professionnels du SELECT, des JOIN et autres ALTER. C'est bien, très bien même, mais maintenant je vais vous apprendre à vous en passer. Et oui, la ligne de commande c'est sympa pour des choses simples et/ou rapides, mais dès que vous voulez plus de complexité, il devient difficile de travailler sans un langage de plus haut niveau...

Opinion :
Lâchez vos coms!

Je souhaiterais partager avec vous dans ce billet quelques petites choses qui relèvent plus de l'anecdote personnelle que de l'article sérieux. J'espère que vous ne m'en voudrez pas si je prends le risque de baisser un peu le niveau de ce blog, mais ça fait un moment que le sujet me trottait en tête.

Les commentaires sont nos amis, il faut les aimer aussi
Il y a quelques temps, j'ai eu un petit débat de fin de journée avec un collègue qui a un bagage très informatique...

Découverte :
ROSALIND : devenez le meilleur bioinformaticien du monde

ROSALIND est un nouveau site web commençant à se faire un nom dans le milieu de la bioinformatique. C'est une plateforme permettant d’apprendre la bioinformatique de manière ludique en donnant des problèmes a résoudre.
Chez bioinfo-fr on aime bien et on a trouvé judicieux de vous le présenter afin que vous puissiez vous en faire votre propre avis. Bonne découverte !
V.O. uniquement
Bon, autant vous prévenir tout de suite : pour les anglophobes il faudra repasser...

Astuce :
Astuce : ajouter des options dans un script Bash avec getopt

But : comprendre le fonctionnement de getopt en Bash pour éviter la multiplications de script là où un seul générique pourrait suffire.
Prérequis : savoir faire des scripts Bash, connaître la substitution de commande et savoir manipuler les arguments.
Difficulté : 2 (moyen)
Pour ceux qui codent en Perl, vous connaissez déjà sûrement le module GetOpt et plus particulièrement son extension GetOpt::Long (ou encore le module getopt du langage Python)...

Découverte :
Bioconductor

Bioconductor
Voilà le sujet que l'on va aborder ensemble aujourd'hui. On va voir ce que c'est, à quoi cela sert, comment l'installer et bien-sûr l'utiliser.
Qu'est-ce donc ?
Je décrirais Bioconductor comme un projet participatif. Il est libre d'accès et son développement dépend de ce que la communauté veut bien y apporter. L'objectif est simple, offrir aux biologistes, un ensemble de programmes pour l'analyse de données, faciles à mettre en place et à utiliser...

Astuce :
SQL Tips : Les transactions

But : Comprendre ce qu'est une transaction au sens SQL du terme, savoir l'utiliser : les avantages, les limitations. J'aborderai superficiellement la notion de degré d'isolation.
Prérequis : Savoir faire des requêtes.
Difficulté : 1 (Facile)
Tout d'abord une définition volontairement simple : une transaction est un ensemble d'une ou plusieurs requêtes SQL regroupées au sein d'un bloc qui est exécuté sur un jeu de données...

Découverte :
TurboGears, petite mise en bouche

TurboGears, Django ou encore Ruby on Rails. Qui n'a jamais entendu parler d'un de ces Frameworks Web de nos jours ? Mais vous y êtes-vous déjà intéressé un peu de plus près ? Cet article sera l'occasion de s'y mettre par exemple !
 Késako ?
Commençons donc par le commencement : qu'est ce qu'un "web meta framework" ? C'est un kit de composants logiciels structurels qui sert à créer les fondations ainsi que les grandes lignes de tout ou d’une partie d'une application web...

Découverte :
Filtre de Bloom

Comme vous le savez sans doute, la génomique tend à générer de plus en plus de données grâce à une forte réduction des coûts (cf graphique ci dessous). Depuis peu de temps, la génération des données n’est plus forcement le point limitant d’une étude, mais c’est l’analyse des données qui devient vraiment longue et coûteuse. De ce fait, les nouveaux logiciels que nous autre, bio-informaticien(ne)s, sommes amené(e)s à développer doivent prendre cette évolution en compte...