Archives par tags: Python

Didacticiel :
Rendre un pipeline Snakemake à l'épreuve des plateformes

"Trans-Alaska Pipeline" by Ted LaBar
Pour avoir été client des articles ("Snakemake pour les nuls",  "Formaliser ses protocoles avec Snakemake" et "Snakemake, aller plus loin avec la parallélisation") de mon prédécesseur lelouar, j'ai décidé d'apporter ma pierre à l'édifice et de continuer cette série sur Snakemake. Je vais ici vous parler de généralisation de pipeline pour l'utilisation intensive au sein d'une plateforme par exemple...

Didacticiel :
Les problèmes limités par les entrées/sorties (IObound)

Dans la première partie de ce tutoriel , j'ai expliqué ce qu’était la programmation concurrente et parallèle, ainsi que détaillé les différents types de programmation concurrente et leurs spécificités. Si vous ne l'avez pas lue, je vous conseille de la lire avant de démarrer. Dans cette deuxième partie, nous allons nous concentrer sur l'optimisation d'un programme limité par les entrées/sorties grâce à la programmation concurrente...

Découverte :
La programmation concurrente en python

Python (source : wikimedia commons, licence CC-BY-SA-4.0 )

Ce tutoriel est une traduction infidèle d'un article de realpython.com https://realpython.com/python-concurrency/#when-to-use-concurrency

Merci à eux pour leur formidable travail et leur autorisation.

Vous avez certainement entendu parler de la librairie asyncio qui a été ajouté à Python 3 et vous êtes curieux de savoir comment elle se place par rapport aux autres méthodes de programmations concurrentes ? Vous voulez savoir ce qu'est la programmation concurrente et comment cela pourrait accélérer vos programmes ? Vos données sont trop grosses et vos calculs ou vos requêtes prennent des heures ? Vous êtes au bon endroit !Dans ce tutoriel nous allons voir :- ce qu'est la programmation concurrente- ce qu'est la parallélisation- les différence entre les méthodes de programmation concurrente (threading, asyncio et multiprocessing)- comment utiliser la programmation concurrente dans vos programmes...

Découverte :
ViLoVar: un outil pour la visualisation de variations génétiques

Pour mon premier article, je vais vous présenter un outil que j'ai développé lorsque je travaillais sur le projet "Myocapture"; un projet national de séquençage d'exomes qui portait sur les myopathies (https://www.afm-telethon.fr/myopathie-congenitale-6675). Ce projet visait à trouver de nouvelles mutations responsables de ces maladies rares. Il a également permis d'identifier de nouveaux gènes impliqués dans des myopathies congénitales...

Suivez l'guide :
#JOBIM2018 : une étude de réseau

Bonjour à tou·te·s !
Comme une partie de la communauté bioinformatique française, et probablement du lectorat de ce blog, je me suis rendu à la 19è édition des Journées Ouvertes en Biologie, Informatique et Mathématiques (JOBIM). Celle-ci se tenait à Marseille, au Palais du Pharo, et pour celles et ceux d'entre vous curieux·ses de connaître le contenu scientifique, voilà le résumé des interventions...

Découverte :
Apprivoiser l'ami ursidé de Python : Pandas

Durant mon stage de M2, j’ai eu l’occasion de chatouiller ce drôle d’animal qu’est pandas. En effet, j’ai travaillé sur des données de protéomique contenues dans des fichiers tabulés. Il s'agissait de comparer la présence des protéines ou leur expression dans différents échantillons. Les abondances relatives (la variable étudiée) étaient indiquées pour les différentes protéines identifiées (plusieurs milliers et correspondant aux lignes du fichier) dans les différents échantillons analysés (correspondant aux colonnes)...

Astuce :
Customiser matplotlib (faire son matplotlibrc)

Suite à une mésaventure liée à matplotlib sur le chan IRC #bioinfo-fr (mésaventure suite aux fameuses erreurs de display ; si vous voulez tout savoir : si on configure mal son matplotlib on peut générer des erreurs qui font qu'on obtient des images vides… voir la partie sur le backend plus tard :o), j'ai parlé de la joie qu'est d'avoir un matplotlibrc et à quel point ça simplifie la vie...

Didacticiel :
Jouer avec l'API de KEGG

Logo de la Kyoto Encyclopedia of Genes and Genomes (KEGG), propriété intellectuelle de Kanehisa Laboratories.
Il n'est pas rare que nous ayons un jour besoin de récupérer des informations de la base de données KEGG (Kyoto Encyclopedia of Genes and Genomes). Cette base de données fournit un nombre conséquent d'informations sur les génomes et les réseaux de gènes mais également sur les voies métaboliques ou les maladies...

Suivez l'guide :
Ajoutez une interface graphique à votre script en 4 lignes avec Gooey

Vous venez de terminer votre analyse bio-informatique. Pour cette dernière, vous avez réalisé un script qui pour l'instant, il faut le dire, n'est pas du tout réutilisable par une tierce personne. Même vous dans 6 mois vous n'êtes pas sûr de vous souvenir de ce que vous avez fait. Pourtant, l'un des intérêts de la programmation est de pouvoir répéter des calculs de manière automatique. Par conséquent, ce serait pratique de rendre votre script un peu plus souple afin de ne pas devoir modifier son code source à chaque fois qu'un paramètre de votre analyse change...

Actualité :
État de l'emploi bioinformatique en France : analyse des offres de la SFBI (2ème partie)

Nous revoilà pour la suite de notre premier article sur l'analyse des offres de la SFBI. On vous avait promis une analyse de l'évolution du marché, et c'est ce dont nous allons parler dans cet article.
Je vous renvoie au premier article si vous voulez plus d'informations sur l'origine des données et la disponibilité du code. Les contributions sur le Github du projet ont été bien ternes... ou plutôt inexistantes...