Archives par tags: Python

J'ai lu :
J'ai lu : Programmation en Python pour les sciences de la vie

Couverture de "Programmation en Python pour les sciences de la vie", par P. Fuchs et P. Poulain

Python et la bioinformatique associés dans un livre, qui plus est écrit par deux maîtres de conférences passionnés de l'Université Paris Diderot que sont Patrick Fuchs et Pierre Poulain : nous nous devions de nous procurer cet ouvrage et de vous en faire une rapide retranscription !

Ce bouquin date de juillet 2019 et c'est tout simplement 275 pages de pur bonheur ! Décomposé en 22 chapitres s'imbriquant tous parfaitement les uns après les autres, il ne peut que (et doit !) devenir une référence dans l'apprentissage du langage Python, avec ou sans bio-informatique derrière...

Editorial :
Concours : Noël avant l'heure !

A l'occasion de la sortie de notre fiche de lecture sur le livre "Programmation en Python pour les sciences de la vie" et sur une gentille proposition de Pierre Poulain & Patrick Fuchs, nous vous proposons un petit jeu concours avant Noël.

Pour participer : il y a dans le livre un petit easter egg placé volontairement (et malicieusement) par nos deux auteurs. La ou le premier qui trouvera cette petite chose rigolote gagnera un livre dédicacé des deux auteurs (idéal pour un cadeau de Noël !) ainsi qu'une belle boite de chocolats ! Gourmandes, gourmands : à vous de jouer !

"hmmmmm"| vmaurin

Participation uniquement par mail à l'adresse concours[CHEZ]bioinfo-fr...

Didacticiel :
Rendre un pipeline Snakemake à l'épreuve des plateformes

"Trans-Alaska Pipeline" by Ted LaBar
Pour avoir été client des articles ("Snakemake pour les nuls",  "Formaliser ses protocoles avec Snakemake" et "Snakemake, aller plus loin avec la parallélisation") de mon prédécesseur lelouar, j'ai décidé d'apporter ma pierre à l'édifice et de continuer cette série sur Snakemake. Je vais ici vous parler de généralisation de pipeline pour l'utilisation intensive au sein d'une plateforme par exemple...

Didacticiel :
Les problèmes limités par les entrées/sorties (IObound)

Dans la première partie de ce tutoriel , j'ai expliqué ce qu’était la programmation concurrente et parallèle, ainsi que détaillé les différents types de programmation concurrente et leurs spécificités. Si vous ne l'avez pas lue, je vous conseille de la lire avant de démarrer. Dans cette deuxième partie, nous allons nous concentrer sur l'optimisation d'un programme limité par les entrées/sorties grâce à la programmation concurrente...

Découverte :
La programmation concurrente en python

Python (source : wikimedia commons, licence CC-BY-SA-4.0 )

Ce tutoriel est une traduction infidèle d'un article de realpython.com https://realpython.com/python-concurrency/#when-to-use-concurrency

Merci à eux pour leur formidable travail et leur autorisation.

Vous avez certainement entendu parler de la librairie asyncio qui a été ajouté à Python 3 et vous êtes curieux de savoir comment elle se place par rapport aux autres méthodes de programmations concurrentes ? Vous voulez savoir ce qu'est la programmation concurrente et comment cela pourrait accélérer vos programmes ? Vos données sont trop grosses et vos calculs ou vos requêtes prennent des heures ? Vous êtes au bon endroit !Dans ce tutoriel nous allons voir :- ce qu'est la programmation concurrente- ce qu'est la parallélisation- les différence entre les méthodes de programmation concurrente (threading, asyncio et multiprocessing)- comment utiliser la programmation concurrente dans vos programmes...

Découverte :
ViLoVar: un outil pour la visualisation de variations génétiques

Pour mon premier article, je vais vous présenter un outil que j'ai développé lorsque je travaillais sur le projet "Myocapture"; un projet national de séquençage d'exomes qui portait sur les myopathies (https://www.afm-telethon.fr/myopathie-congenitale-6675). Ce projet visait à trouver de nouvelles mutations responsables de ces maladies rares. Il a également permis d'identifier de nouveaux gènes impliqués dans des myopathies congénitales...

Suivez l'guide :
#JOBIM2018 : une étude de réseau

Bonjour à tou·te·s !
Comme une partie de la communauté bioinformatique française, et probablement du lectorat de ce blog, je me suis rendu à la 19è édition des Journées Ouvertes en Biologie, Informatique et Mathématiques (JOBIM). Celle-ci se tenait à Marseille, au Palais du Pharo, et pour celles et ceux d'entre vous curieux·ses de connaître le contenu scientifique, voilà le résumé des interventions...

Découverte :
Apprivoiser l'ami ursidé de Python : Pandas

Durant mon stage de M2, j’ai eu l’occasion de chatouiller ce drôle d’animal qu’est pandas. En effet, j’ai travaillé sur des données de protéomique contenues dans des fichiers tabulés. Il s'agissait de comparer la présence des protéines ou leur expression dans différents échantillons. Les abondances relatives (la variable étudiée) étaient indiquées pour les différentes protéines identifiées (plusieurs milliers et correspondant aux lignes du fichier) dans les différents échantillons analysés (correspondant aux colonnes)...

Astuce :
Customiser matplotlib (faire son matplotlibrc)

Suite à une mésaventure liée à matplotlib sur le chan IRC #bioinfo-fr (mésaventure suite aux fameuses erreurs de display ; si vous voulez tout savoir : si on configure mal son matplotlib on peut générer des erreurs qui font qu'on obtient des images vides… voir la partie sur le backend plus tard :o), j'ai parlé de la joie qu'est d'avoir un matplotlibrc et à quel point ça simplifie la vie...

Didacticiel :
Jouer avec l'API de KEGG

Logo de la Kyoto Encyclopedia of Genes and Genomes (KEGG), propriété intellectuelle de Kanehisa Laboratories.
Il n'est pas rare que nous ayons un jour besoin de récupérer des informations de la base de données KEGG (Kyoto Encyclopedia of Genes and Genomes). Cette base de données fournit un nombre conséquent d'informations sur les génomes et les réseaux de gènes mais également sur les voies métaboliques ou les maladies...