Archives par tags: Python

Astuce :
Customiser matplotlib (faire son matplotlibrc)

Suite à une mésaventure liée à matplotlib sur le chan IRC #bioinfo-fr (mésaventure suite aux fameuses erreurs de display ; si vous voulez tout savoir : si on configure mal son matplotlib on peut générer des erreurs qui font qu'on obtient des images vides… voir la partie sur le backend plus tard :o), j'ai parlé de la joie qu'est d'avoir un matplotlibrc et à quel point ça simplifie la vie...

Didacticiel :
Jouer avec l'API de KEGG

Il n'est pas rare que nous ayons un jour besoin de récupérer des informations de la base de données KEGG (Kyoto Encyclopedia of Genes and Genomes). Cette base de données fournit un nombre conséquent d'informations sur les génomes et les réseaux de gènes mais également sur les voies métaboliques ou les maladies. Dans ces cas là, bien souvent, nous passons directement par le site internet à l'adresse http://www...

Suivez l'guide :
Ajoutez une interface graphique à votre script en 4 lignes avec Gooey

Vous venez de terminer votre analyse bio-informatique. Pour cette dernière, vous avez réalisé un script qui pour l'instant, il faut le dire, n'est pas du tout réutilisable par une tierce personne. Même vous dans 6 mois vous n'êtes pas sûr de vous souvenir de ce que vous avez fait. Pourtant, l'un des intérêts de la programmation est de pouvoir répéter des calculs de manière automatique. Par conséquent, ce serait pratique de rendre votre script un peu plus souple afin de ne pas devoir modifier son code source à chaque fois qu'un paramètre de votre analyse change...

Actualité :
État de l'emploi bioinformatique en France : analyse des offres de la SFBI (2ème partie)

Nous revoilà pour la suite de notre premier article sur l'analyse des offres de la SFBI. On vous avait promis une analyse de l'évolution du marché, et c'est ce dont nous allons parler dans cet article.
Je vous renvoie au premier article si vous voulez plus d'informations sur l'origine des données et la disponibilité du code. Les contributions sur le Github du projet ont été bien ternes... ou plutôt inexistantes...

Didacticiel :
Snakemake aller plus loin avec la parallélisation

Bonjour à tous, bienvenue dans un nouvel épisode de tutoriels sur Snakemake (épisode précédent).
Aujourd'hui nous allons voir ensemble comment paralléliser facilement par la donnée grâce à Snakemake. L'idée générale consiste à découper les fichiers bruts au début de notre pipeline et de les rassembler après les étapes lourdes en calcul.

Nous allons également voir comment utiliser le fichier de configuration au format Json...

Didacticiel :
Écrire son parseur à la main — chroniques d'une mauvaise bonne idée

Partie 1
Où l'on prend conscience de l'existence de standards, et de leur nécessité.

Tout petit programme s'éveillant au monde se trouvera un jour face à ses obligations : s’interfacer avec ce dernier. La lumière extérieure devra alors pénétrer son petit antre, apportant malicieusement l'information de mille autres petits programmes, si hétéroclites et désordonnés que nul ne sais vraiment qui fait quoi...

Découverte :
Les dev' jam c'est bon pour vous !

Les tribulations de bioinformaticiens en territoire sarthois.
Ou pourquoi les dev' jam, c'est le bien.
Préambule glorieux.
Bonjour à tous !
Vous trouverez dans cet article (mon premier sur internet <3) mon retour sur ma première dev' jam, et l'intérêt qu'il peut y avoir, en tant que bioinformaticien, à se rendre à un tel évènement. Pour ceux qui ne connaitraient pas, une development jam est une sorte de concours de programmation en équipe sur un ou plusieurs sujets imposés, sur une durée de temps limitée (généralement un week-end)...

Astuce :
Snakemake pour les nuls (ou comment créer un pipeline facilement ?)

Bonjour à tous, et bienvenue dans le premier épisode d'une (longue ?) série de prise en main de l'outil dédié au pipeline : Snakemake.
Si vous ne connaissez pas encore cet outil, c'est que vous êtes sûrement passés à côté de cet article écrit par Nisaea. Alors, quel sera les bénéfices de retranscrire vos pipelines déjà tout prêt en Snakefile ?
Lisibilité du code, gestion des ressources et reproductibilité

Lorsque vous êtes sur le point de publier,  il va bien falloir expliquer aux futurs lecteurs comment vous avez obtenu les résultats...

Didacticiel :
Python, dessine-moi un graphe

Derrière ce titre énigmatique, qui n'aura pas été sans vous rappeler la fameuse phrase du Petit Prince d'Antoine de Saint Exupéry, se cache un module pour Python qui dira sûrement quelque chose à nos lecteurs assidus spécialisés dans les graphes : pygraphviz !
Ce module a été créé autour de GraphViz et vous permet ainsi de faire des graphes sous Python en respectant les normes établies par GraphViz et, par conséquent, d'exporter ou d'importer très facilement vos graphes pour vos différents projets...

Astuce :
RNA-seq : plus de profondeur ou plus d'échantillons ?

Lorsque l'on se lance dans l'aventure du séquençage haut débit de transcriptome, on est amené à se poser LA question, oui LA, celle que l'on redoute à peu près tous quand on a un budget serré :
À quelle profondeur dois-je séquencer mes échantillons ?
Toutes les publications s'accordent à le dire, plus on a de réplicats, plus on a de puissance statistique pour détecter les gènes différentiellement exprimés...