Découverte :
Métabarcodes de l'ADN environnemental

L'une des technologies en génomique les plus prometteuses pour l'évaluation de la biodiversité est le métabarcode (de l'anglais metabarcoding) de l'ADN environnemental (ADNe). J'ai travaillé longuement sur ces méthodes et développé plusieurs workflows pour traiter et analyser les données de métabarcodes. J'ai notamment été en charge du traitement des données génomiques récoltées par l’expédition scientifique d'exploration marine de Monaco entre 2018 et 2020...

Découverte :
Pourquoi certains fichiers FASTQ finissent par 001 ?

Les fichiers .fastq finissant en _001.fastq.gz

Sur le chan IRC du blog, un de nos membres se demandait pourquoi les noms de fichiers FASTQ devait finir par _001.fastq sur la plateforme de cloud computing d'Illumina BaseSpace. Mais avant de répondre à cette question pressante, repartons du début.

Les fichiers FASTQ

En cette période de domination du séquençage haut débit de l'ADN, le format de fichier ...

Découverte :
La transcriptomique spatiale

Non, on ne va pas partir faire du RNA-seq dans la station spatiale internationale, rassurez-vous. Je vais vous parler de cette (relativement) nouvelle technique qui permet en une seule expérience de mesurer l'expression des gènes et de localiser cette expression dans un organe plus ou moins complexe.
Pour faire une analyse à large échelle du niveau d'expression des gènes dans un tissu, rien ne vaut la transcriptomique...

Découverte :
1... 2... 3... 4C ! Ou comment capturer l'état de la chromatine.

Une cellule eucaryote comporte un noyau qui contient l’information génétique portée par les chromosomes, eux même composés d’ADN. Chez l'Homme, l'ADN des chromosomes mis bouts à bouts mesure 1,9 mètre de long. Or, tout ce matériel génétique doit tenir dans le noyau des cellules, qui lui mesure 5 à 7 micromètres de diamètre (en moyenne chez l'Homme). Pour cela, l'ADN va être compacté à l'aide de protéines pour former la chromatine (Fig...

Découverte :
Contrarié par les diagrammes de Venn ? Découvrez les diagrammes UpSet

Titre incluant un moyen mnémotechnique ;D

Avec ses cercles entrecroisés, on ne présente plus le célèbre diagramme de Venn. Cette représentation est utilisée dans le cas où l'on souhaite représenter le recoupement de données de nombre fini selon plusieurs variables qualitatives. De façon plus simple lorsqu'on a 2 variables qualitatives : combien d'éléments présents dans la catégorie A sont également présents ou non dans la catégorie B

Pourquoi des diagrammes "de Venn" ?

S'il est sûr que ces diagrammes représentant des proportions et leur partage date d'avant 1918, c'est à cette date que Clarence Irving Lewis (philosophe et logicien) utilise le terme de "diagramme de Venn"...

Découverte :
Génomique des paysages

Introduction

Edunia par Eduardo Kac, une fleur érigée au rang d'oeuvre d'art. L'ADN de cette fleur contient une partie du génome humain de son jardinier. Crédit : CC-BY-NC-ND Ars Electronica pour Eduardo Kac

« Génomique des paysages » cela sonne comme le titre d’une œuvre d’Eduardo Kac. Ce nom un peu post-moderne désigne en fait une discipline scientifique qui a connu une expansion fulgurante au cours de la dernière décennie...

Découverte :
Sept problèmes fascinants posés par les récepteurs olfactifs

Le cinquième va vous étonner !

Introduction: l'olfaction, un sens assez bien compris et compréhensible

L’olfaction n'est peut-être pas le plus noble des sens, comparé à la vue ou l’ouïe par exemple, mais il s'agit d'un sens assez bien compris aujourd'hui. C'est notamment grâce aux travaux des biologistes Linda B. Buck et Richard Axel, récompensés par un prix Nobel de physiologie et de médecine en 2004...

Découverte :
Les tests en bioinformatique

Tester est-ce douter ?

Aujourd'hui on va parler d'un truc très connu des informaticiens mais encore trop peu connu en bio-informatique : les tests.
Cette pratique est pourtant conseillée dans le guide du bon broinformaticien . Alors, qu'est ce qu'un test ?
Un test désigne une procédure de vérification d'un système. Son objectif principal est d'identifier un nombre maximum de comportements problématiques du logiciel afin d'en augmenter la qualité (si les problèmes identifiés lors des tests sont corrigés)...

Découverte :
Rendre ses projets R plus accessibles grâce à Shiny

Bonjour à tous !

Vous avez un script que vous souhaitez partager avec une équipe expérimentale? Vous ne voulez pas que les utilisateurs modifient le code pour paramétrer votre programme? Vous codez avec R ? Alors cet article est fait pour vous ! Nous allons voir comment créer une application web avec R et permettre à votre utilisateur d’exécuter votre code sans le voir.

Shiny

Le package que nous utiliserons est shiny...

Découverte :
La programmation concurrente en python

Python (source : wikimedia commons, licence CC-BY-SA-4.0 )

Ce tutoriel est une traduction infidèle d'un article de realpython.com https://realpython.com/python-concurrency/#when-to-use-concurrency

Merci à eux pour leur formidable travail et leur autorisation.

Vous avez certainement entendu parler de la librairie asyncio qui a été ajouté à Python 3 et vous êtes curieux de savoir comment elle se place par rapport aux autres méthodes de programmations concurrentes ? Vous voulez savoir ce qu'est la programmation concurrente et comment cela pourrait accélérer vos programmes ? Vos données sont trop grosses et vos calculs ou vos requêtes prennent des heures ? Vous êtes au bon endroit !Dans ce tutoriel nous allons voir :- ce qu'est la programmation concurrente- ce qu'est la parallélisation- les différence entre les méthodes de programmation concurrente (threading, asyncio et multiprocessing)- comment utiliser la programmation concurrente dans vos programmes...