Catégorie : Découverte
-
La programmation concurrente en python
Ce tutoriel est une traduction infidèle d'un article de realpython.com https://realpython.com/python-concurrency/#when-to-use-concurrency Merci à eux pour leur formidable travail et leur autorisation. Vous avez certainement entendu parler de la librairie asyncio qui a été ajouté à Python 3 et vous êtes curieux de savoir comment elle se place par rapport aux autres méthodes de programmations concurrentes ?…
-
Traquer les régions ouvertes de l'ADN avec l'ATAC-seq
L'étude de la régulation de l'expression des gènes est une discipline complexe qui recoupe des données provenant de divers types d'expériences. Dans un précédent article, nous avions vu trois techniques de biologie moléculaire couplées à du séquençage haut débit classiquement employées pour mettre en évidence les régions accessibles de l'ADN, et donc potentiellement des régions…
-
ViLoVar : un outil pour la visualisation de variations génétiques
Pour mon premier article, je vais vous présenter un outil que j'ai développé lorsque je travaillais sur le projet "Myocapture"; un projet national de séquençage d'exomes qui portait sur les myopathies (https://www.afm-telethon.fr/myopathie-congenitale-6675). Ce projet visait à trouver de nouvelles mutations responsables de ces maladies rares. Il a également permis d'identifier de nouveaux gènes impliqués dans…
-
Bioconvert — simplifier les conversions de formats
Bioconvert Qui n'a jamais eu à convertir un fichier de données biologiques dans un autre format ? Il y a bien sur le classique fastq vers fasta, pour lequel nombre d'entre nous ont codé un convertisseur "maison", pas forcément optimal. D'autres formats sont parfois plus problématiques, par exemple la conversion vers et depuis GFF2/GFF3. De ces différents…
-
canSnippet : le voilà !
Nous vous l'avions annoncé il y a quasiment un an jour pour jour lors de notre présentation à JOBIM2017 à Lille. Il est maintenant là, disponible, consultable et à portée de tous : canSnippet Community Edition. A vos marques pages, c'est ici que ça se passera dorénavant : https://cansnippet.bioinfo-fr.net/ ! Le principe Avoir une collection de snippets…
-
Apprivoiser l'ami ursidé de Python : Pandas
Durant mon stage de M2, j’ai eu l’occasion de chatouiller ce drôle d’animal qu’est pandas. En effet, j’ai travaillé sur des données de protéomique contenues dans des fichiers tabulés. Il s'agissait de comparer la présence des protéines ou leur expression dans différents échantillons. Les abondances relatives (la variable étudiée) étaient indiquées pour les différentes protéines…
-
Qu'est-ce qu'un site d'initiation de la transcription ?
Comment je me suis posé la question. Chez les eucaryotes, l'ADN est organisé en domaines plus ou moins compactés, avec des taux de transcription plus ou moins élevés, et qui sont marqués différentiellement par un certain nombre de marques épigénétiques (méthylation de l'ADN, modifications post-traductionnelles des histones, variants d'histones, etc.). Il est fréquent d'essayer de…
-
Les bases de données de séquençage : GEO, SRA, ENA, ArrayExpress
De nos jours, lors de la publication de résultats, il est nécessaire de rendre public les éventuelles données de séquençage générées. Si un faible nombre d’irréductibles continuent à ne fournir les données que sur demande, les bonnes pratiques poussent à les déposer dans des bases de données librement accessibles. Quatre grandes bases de données de séquençage…