Archives par tags: programmation

Didacticiel :
Jouer avec l'API de KEGG

Il n'est pas rare que nous ayons un jour besoin de récupérer des informations de la base de données KEGG (Kyoto Encyclopedia of Genes and Genomes). Cette base de données fournit un nombre conséquent d'informations sur les génomes et les réseaux de gènes mais également sur les voies métaboliques ou les maladies. Dans ces cas là, bien souvent, nous passons directement par le site internet à l'adresse http://www...

Découverte :
Rust, un super héros au secours de la bio-informatique ?

 
Rust est la traduction du mot "rouille" en anglais, ainsi qu'un jeu vidéo de survie post-apocalyptique, mais c'est aussi un langage de programmation. Et vous devez maintenant vous demander :
Encore un autre langage, mais pourquoi ?
Les origines
En 2006 Graydon Hoare, un développeur chez Mozilla, commence un projet personnel, un nouveau langage de programmation qu'il va nommer Rust. Trois ans plus tard, le langage est jugé suffisamment mature pour intéresser Mozilla, qui décide de le prendre sous son aile...

Découverte :
Software Carpentry ou la transmission de bonnes pratiques en informatique

Avec l’augmentation de la capacité des ordinateurs et de la qualité des algorithmes, l’informatique prend une place de plus en plus importante dans la vie de tous les jours, mais aussi dans la recherche. Cela est rendu aussi possible grâce à la programmation et aux améliorations des languages, des outils et des pratiques. Les développeurs sont devenus plus productifs.

Mais l’impact sur les scientifiques est plus mitigé...

Didacticiel :
Écrire son parseur à la main — chroniques d'une mauvaise bonne idée

Partie 1
Où l'on prend conscience de l'existence de standards, et de leur nécessité.

Tout petit programme s'éveillant au monde se trouvera un jour face à ses obligations : s’interfacer avec ce dernier. La lumière extérieure devra alors pénétrer son petit antre, apportant malicieusement l'information de mille autres petits programmes, si hétéroclites et désordonnés que nul ne sais vraiment qui fait quoi...

Didacticiel :
Git : cloner un projet, travailler à plusieurs et créer des branches

 Git est un logiciel de contrôle de versions de fichiers. Il est distribué sous licence GNU GPLv2 et est disponible sur les principaux systèmes d'exploitation.
Dans l'article précédent, nous avions vu comment installer et configurer git, comment créer un dépôt pour un projet, ainsi que les principes de base de gestion de versions.
Dans cet article, nous verrons comment cloner un projet (par exemple pour travailler à plusieurs ou pour faire des sauvegardes), comment synchroniser les différentes copies tout en détectant et résolvant les problèmes éventuels, et comment créer des branches et indiquer les étapes qui correspondent à des versions...

Découverte :
Gérer les versions de vos fichiers : premiers pas avec git

Git est un logiciel de contrôle de versions de fichiers. Il est distribué sous licence GNU GPLv2 et est disponible sur les principaux systèmes d'exploitation.
Cet article est le premier d'une série de deux. Nous allons voir ici (1) à quoi sert le contrôle de versions, (2) comment configurer git et (3) les bases de son utilisation.
Dans l'article suivant, nous verrons comment cloner un projet (par exemple pour travailler à plusieurs ou pour faire des sauvegardes) et comment synchroniser les différentes copies...

Astuce :
L'annotation de régions génomiques et les analyses d’enrichissement

Les annotations sont essentielles lors d'analyses fonctionnelles à large échelle sur le génome. 
Lorsque l’on pratique des analyses en génomique, basées sur des techniques comme le RNA-seq ou le ChIP-seq, on se retrouve avec respectivement une liste de transcrits ou de pics (régions génomiques). Dans le cas des analyses ChIP-seq, on souhaite caractériser les gènes cibles du facteur de transcription étudié sur tout le génome (genome-wide), pour comprendre la fonction biologique de ce facteur...

Découverte :
Cython: votre programme Python mais 100x plus vite

Python est un langage extrêmement pratique car il est facile à lire et à écrire, comparé à un langage de "bas niveau" et compilé comme le C. D'un autre côté, à l'exécution il est beaucoup plus lent. C'est un compromis entre les deux qu'offre Cython, permettant d'accélérer votre programme d'un facteur 2 à plus de 100, et d'intégrer facilement des fonctions déjà écrites en C - d'où son nom...

Astuce :
The Bio Code : guide du bon broinformaticien

Malgré la multitude d’outils déjà existants, les occasions d'écrire du code sont nombreuses en bioinformatique. Hormis pour les pousse-boutons avertis, le développement fait souvent partie du quotidien d’un bioinformaticien. Personnellement, c’est une activité qui me plaît beaucoup dans ce métier. Développer ses propres applications et outils apporte toujours une certaine satisfaction (et quand ça fonctionne, c’est encore mieux !)...

Didacticiel :
Parser des fichiers HTML en Python

Langage : Python
Bibliothèques : bioservices, HTMLParser, re (partiellement)
Niveau : débutant-intermédiaire
Dans un article précédent, je vous ai présenté le module bioservices en Python. Au cours de mon travail j'ai été amenée à récupérer des informations sur les termes Gene Ontology, et notamment sur les relations entre différents termes. Cependant, les formats de fichiers récupérés sont différents en fonction des données qu'ils renferment...