Archives par tags: Python

Astuce :
Snakemake pour les nuls (ou comment créer un pipeline facilement ?)

Bonjour à tous, et bienvenue dans le premier épisode d'une (longue ?) série de prise en main de l'outil dédié au pipeline : Snakemake.
Si vous ne connaissez pas encore cet outil, c'est que vous êtes sûrement passés à côté de cet article écrit par Nisaea. Alors, quel sera les bénéfices de retranscrire vos pipelines déjà tout prêt en Snakefile ?
Lisibilité du code, gestion des ressources et reproductibilité
Snake | Crystal Sanchez
Lorsque vous êtes sur le point de publier,  il va bien falloir expliquer aux futurs lecteurs comment vous avez obtenu les résultats...

Didacticiel :
Python, dessine-moi un graphe

Derrière ce titre énigmatique, qui n'aura pas été sans vous rappeler la fameuse phrase du Petit Prince d'Antoine de Saint Exupéry, se cache un module pour Python qui dira sûrement quelque chose à nos lecteurs assidus spécialisés dans les graphes : pygraphviz !
Ce module a été créé autour de GraphViz et vous permet ainsi de faire des graphes sous Python en respectant les normes établies par GraphViz et, par conséquent, d'exporter ou d'importer très facilement vos graphes pour vos différents projets...

Astuce :
RNA-seq : plus de profondeur ou plus d'échantillons ?

(Marco Bellucci, CC BY)
Lorsque l'on se lance dans l'aventure du séquençage haut débit de transcriptome, on est amené à se poser LA question, oui LA, celle que l'on redoute à peu près tous quand on a un budget serré :
À quelle profondeur dois-je séquencer mes échantillons ?
Toutes les publications s'accordent à le dire, plus on a de réplicats, plus on a de puissance statistique pour détecter les gènes différentiellement exprimés...

Découverte :
Python fait la numba

Suite à cet article, j'ai eu envie de comparer les temps d'exécution de Cython et Numba.
Il est toujours intéressant de faire des tests de performances (benchmarks) de temps à autre, pour voir si on ne peut pas améliorer certains de nos algorithmes 🙂 Cython est un très bon moyen pour optimiser vos programmes, mais il est encore compliqué (pour moi) à appréhender et nécessite de faire des efforts d'apprentissage pour accéder à toute sa puissance...

Découverte :
Cython: votre programme Python mais 100x plus vite

Python est un langage extrêmement pratique car il est facile à lire et à écrire, comparé à un langage de "bas niveau" et compilé comme le C. D'un autre côté, à l'exécution il est beaucoup plus lent. C'est un compromis entre les deux qu'offre Cython, permettant d'accélérer votre programme d'un facteur 2 à plus de 100, et d'intégrer facilement des fonctions déjà écrites en C - d'où son nom...

Didacticiel :
Parser des fichiers HTML en Python

I can haz HTML (CC-BY Tomomi)
Langage : Python
Bibliothèques : bioservices, HTMLParser, re (partiellement)
Niveau : débutant-intermédiaire
Dans un article précédent, je vous ai présenté le module bioservices en Python. Au cours de mon travail j'ai été amenée à récupérer des informations sur les termes Gene Ontology, et notamment sur les relations entre différents termes. Cependant, les formats de fichiers récupérés sont différents en fonction des données qu'ils renferment...

Découverte :
Bioservices, un module Python très utile

Logo officiel du langage de programmation Python |Tous droits réservés
Dans notre domaine si vaste, il existe de nombreuses bases de données (cf. Bases de données, notions par nahoy), et parmi ces bases, un certain nombre d'entre elles propose un service web pour accéder à leurs données à partir d'un script. Le problème principal qui peut nous freiner, ou nous faire peur, lorsque l'on se lance dans cette quête, c'est le nombre de services web dont nous devrons connaître la technologie...

Découverte :
Jouez avec vos données : utilisez un ORM

Il y a quelques temps, je vous ai parlé de base de données, un super moyen pour structurer vos données.
Vous êtes maintenant j'en suis sûr, des professionnels du SELECT, des JOIN et autres ALTER. C'est bien, très bien même, mais maintenant je vais vous apprendre à vous en passer. Et oui, la ligne de commande c'est sympa pour des choses simples et/ou rapides, mais dès que vous voulez plus de complexité, il devient difficile de travailler sans un langage de plus haut niveau...

Découverte :
ROSALIND : devenez le meilleur bioinformaticien du monde

Logo de rosalind.info
ROSALIND est un nouveau site web commençant à se faire un nom dans le milieu de la bioinformatique. C'est une plateforme permettant d’apprendre la bioinformatique de manière ludique en donnant des problèmes a résoudre.
Chez bioinfo-fr on aime bien et on a trouvé judicieux de vous le présenter afin que vous puissiez vous en faire votre propre avis. Bonne découverte !
V...

Astuce :
Astuce programmation BioPython : Parser les multi-genbank et les multi-FASTA produits par Batch Entrez

Prérequis : Savoir 'un peu' se servir d'un shell et avoir installé Python et son module Bio.
But : Redécouper des multi-genbank ou des multi-FASTA en un fichier par entrée.
Difficulté : 2/5 (Facile)
Principe : Le NCBI propose un outil très pratique pour récupérer facilement des jeux de données diversifiés : BatchEntrez, vous trouverez plus d'information ici. On télécharge ainsi un fichier texte unique réunissant toutes les données...