Archives par tags: Python

Opinion :
Choisir entre R et Python en bioinformatique ? Regards croisés entre collègues enseignants-chercheurs

Gaëlle Lelandais et Pierre Poulain

Qui sommes-nous ?

Tous les deux passionnés par l’enseignement, les problématiques de big data et d’analyse de données en biologie, nous nous côtoyons professionnellement depuis 15 ans, avec écoute et bienveillance. Si l’étiquette de « bioinformaticien » nous est souvent attribuée, nous sommes pourtant très différents.

Je (Gaëlle) travaille sur des problématiques de génomique fonctionnelle des champignons...

Didacticiel :
Installer JupyterHub pour des Notebooks hébergés sur votre serveur

Vous connaissez sans doute déjà les notebooks Jupyter [1], ces documents web où l'on peut
rédiger du contenu en Markdown, pouvant contenir des formules mathématiques en LaTeX, mêlées à des cellules de code
Python, (ou R, Julia etc.) que l'on peut exécuter au cas par cas de façon interactive. Ils sont pas mal utilisés en
data science pour explorer un jeu de données où créer un modèle de machine learning progressivement, par exemple...

J'ai lu :
J'ai lu : Programmation en Python pour les sciences de la vie

Couverture de "Programmation en Python pour les sciences de la vie", par P. Fuchs et P. Poulain

Python et la bioinformatique associés dans un livre, qui plus est écrit par deux maîtres de conférences passionnés de l'Université Paris Diderot que sont Patrick Fuchs et Pierre Poulain : nous nous devions de nous procurer cet ouvrage et de vous en faire une rapide retranscription !

Ce bouquin date de juillet 2019 et c'est tout simplement 275 pages de pur bonheur ! Décomposé en 22 chapitres s'imbriquant tous parfaitement les uns après les autres, il ne peut que (et doit !) devenir une référence dans l'apprentissage du langage Python, avec ou sans bio-informatique derrière...

Editorial :
Concours : Noël avant l'heure !

A l'occasion de la sortie de notre fiche de lecture sur le livre "Programmation en Python pour les sciences de la vie" et sur une gentille proposition de Pierre Poulain & Patrick Fuchs, nous vous proposons un petit jeu concours avant Noël.

Pour participer : il y a dans le livre un petit easter egg placé volontairement (et malicieusement) par nos deux auteurs. La ou le premier qui trouvera cette petite chose rigolote gagnera un livre dédicacé des deux auteurs (idéal pour un cadeau de Noël !) ainsi qu'une belle boite de chocolats ! Gourmandes, gourmands : à vous de jouer !

"hmmmmm"| vmaurin

Participation uniquement par mail à l'adresse concours[CHEZ]bioinfo-fr...

Didacticiel :
Rendre un pipeline Snakemake à l'épreuve des plateformes

"Trans-Alaska Pipeline" by Ted LaBar
Pour avoir été client des articles ("Snakemake pour les nuls",  "Formaliser ses protocoles avec Snakemake" et "Snakemake, aller plus loin avec la parallélisation") de mon prédécesseur lelouar, j'ai décidé d'apporter ma pierre à l'édifice et de continuer cette série sur Snakemake. Je vais ici vous parler de généralisation de pipeline pour l'utilisation intensive au sein d'une plateforme par exemple...

Didacticiel :
Les problèmes limités par les entrées/sorties (IObound)

Dans la première partie de ce tutoriel , j'ai expliqué ce qu’était la programmation concurrente et parallèle, ainsi que détaillé les différents types de programmation concurrente et leurs spécificités. Si vous ne l'avez pas lue, je vous conseille de la lire avant de démarrer. Dans cette deuxième partie, nous allons nous concentrer sur l'optimisation d'un programme limité par les entrées/sorties grâce à la programmation concurrente...

Découverte :
La programmation concurrente en python

Python (source : wikimedia commons, licence CC-BY-SA-4.0 )

Ce tutoriel est une traduction infidèle d'un article de realpython.com https://realpython.com/python-concurrency/#when-to-use-concurrency

Merci à eux pour leur formidable travail et leur autorisation.

Vous avez certainement entendu parler de la librairie asyncio qui a été ajouté à Python 3 et vous êtes curieux de savoir comment elle se place par rapport aux autres méthodes de programmations concurrentes ? Vous voulez savoir ce qu'est la programmation concurrente et comment cela pourrait accélérer vos programmes ? Vos données sont trop grosses et vos calculs ou vos requêtes prennent des heures ? Vous êtes au bon endroit !Dans ce tutoriel nous allons voir :- ce qu'est la programmation concurrente- ce qu'est la parallélisation- les différence entre les méthodes de programmation concurrente (threading, asyncio et multiprocessing)- comment utiliser la programmation concurrente dans vos programmes...

Découverte :
ViLoVar: un outil pour la visualisation de variations génétiques

Pour mon premier article, je vais vous présenter un outil que j'ai développé lorsque je travaillais sur le projet "Myocapture"; un projet national de séquençage d'exomes qui portait sur les myopathies (https://www.afm-telethon.fr/myopathie-congenitale-6675). Ce projet visait à trouver de nouvelles mutations responsables de ces maladies rares. Il a également permis d'identifier de nouveaux gènes impliqués dans des myopathies congénitales...

Suivez l'guide :
#JOBIM2018 : une étude de réseau

Bonjour à tou·te·s !
Comme une partie de la communauté bioinformatique française, et probablement du lectorat de ce blog, je me suis rendu à la 19è édition des Journées Ouvertes en Biologie, Informatique et Mathématiques (JOBIM). Celle-ci se tenait à Marseille, au Palais du Pharo, et pour celles et ceux d'entre vous curieux·ses de connaître le contenu scientifique, voilà le résumé des interventions...

Découverte :
Apprivoiser l'ami ursidé de Python : Pandas

Durant mon stage de M2, j’ai eu l’occasion de chatouiller ce drôle d’animal qu’est pandas. En effet, j’ai travaillé sur des données de protéomique contenues dans des fichiers tabulés. Il s'agissait de comparer la présence des protéines ou leur expression dans différents échantillons. Les abondances relatives (la variable étudiée) étaient indiquées pour les différentes protéines identifiées (plusieurs milliers et correspondant aux lignes du fichier) dans les différents échantillons analysés (correspondant aux colonnes)...