Étiquette : Python
-
Python, dessine-moi un graphe
Derrière ce titre énigmatique, qui n'aura pas été sans vous rappeler la fameuse phrase du Petit Prince d'Antoine de Saint Exupéry, se cache un module pour Python qui dira sûrement quelque chose à nos lecteurs assidus spécialisés dans les graphes : pygraphviz ! Ce module a été créé autour de GraphViz et vous permet ainsi de faire…
-
RNA-seq : plus de profondeur ou plus d'échantillons ?
Lorsque l'on se lance dans l'aventure du séquençage haut débit de transcriptome, on est amené à se poser LA question, oui LA, celle que l'on redoute à peu près tous quand on a un budget serré : À quelle profondeur dois-je séquencer mes échantillons ? Toutes les publications s'accordent à le dire, plus on a de réplicats,…
-
Python fait la numba
Suite à cet article, j'ai eu envie de comparer les temps d'exécution de Cython et Numba. Il est toujours intéressant de faire des tests de performances (benchmarks) de temps à autre, pour voir si on ne peut pas améliorer certains de nos algorithmes 🙂 Cython est un très bon moyen pour optimiser vos programmes, mais…
-
Cython : votre programme Python mais 100x plus vite
Python est un langage extrêmement pratique car il est facile à lire et à écrire, comparé à un langage de "bas niveau" et compilé comme le C. D'un autre côté, à l'exécution il est beaucoup plus lent. C'est un compromis entre les deux qu'offre Cython, permettant d'accélérer votre programme d'un facteur 2 à plus de…
-
Parser des fichiers HTML en Python
Langage : Python Bibliothèques : bioservices, HTMLParser, re (partiellement) Niveau : débutant-intermédiaire Dans un article précédent, je vous ai présenté le module bioservices en Python. Au cours de mon travail j'ai été amenée à récupérer des informations sur les termes Gene Ontology, et notamment sur les relations entre différents termes. Cependant, les formats de fichiers récupérés sont différents…
-
Bioservices, un module Python très utile
Dans notre domaine si vaste, il existe de nombreuses bases de données (cf. Bases de données, notions par nahoy), et parmi ces bases, un certain nombre d'entre elles propose un service web pour accéder à leurs données à partir d'un script. Le problème principal qui peut nous freiner, ou nous faire peur, lorsque l'on se…
-
Jouez avec vos données : utilisez un ORM
Il y a quelques temps, je vous ai parlé de base de données, un super moyen pour structurer vos données. Vous êtes maintenant j'en suis sûr, des professionnels du SELECT, des JOIN et autres ALTER. C'est bien, très bien même, mais maintenant je vais vous apprendre à vous en passer. Et oui, la ligne de…
-
ROSALIND : devenez le meilleur bioinformaticien du monde
ROSALIND est un nouveau site web commençant à se faire un nom dans le milieu de la bioinformatique. C'est une plateforme permettant d’apprendre la bioinformatique de manière ludique en donnant des problèmes a résoudre. Chez bioinfo-fr on aime bien et on a trouvé judicieux de vous le présenter afin que vous puissiez vous en faire…
-
Astuce programmation BioPython : Parser les multi-genbank et les multi-FASTA produits par Batch Entrez
Prérequis : Savoir 'un peu' se servir d'un shell et avoir installé Python et son module Bio. But : Redécouper des multi-genbank ou des multi-FASTA en un fichier par entrée. Difficulté : 2/5 (Facile) Principe : Le NCBI propose un outil très pratique pour récupérer facilement des jeux de données diversifiés : BatchEntrez, vous trouverez plus d'information ici. On télécharge ainsi un…