Archives par tags: base de données

Découverte :
Les bases de données de séquençage : GEO, SRA, ENA, ArrayExpress

De nos jours, lors de la publication de résultats, il est nécessaire de rendre public les éventuelles données de séquençage générées. Si un faible nombre d’irréductibles continuent à ne fournir les données que sur demande, les bonnes pratiques poussent à les déposer dans des bases de données librement accessibles. Quatre grandes bases de données de séquençage existent : les états-uniennes  GEO et SRA du NCBI, et les européennes ArrayExpress et ENA de l'EMBL-EBI...

Didacticiel :
Jouer avec l'API de KEGG

Il n'est pas rare que nous ayons un jour besoin de récupérer des informations de la base de données KEGG (Kyoto Encyclopedia of Genes and Genomes). Cette base de données fournit un nombre conséquent d'informations sur les génomes et les réseaux de gènes mais également sur les voies métaboliques ou les maladies. Dans ces cas là, bien souvent, nous passons directement par le site internet à l'adresse http://www...

En image :

Quand le bioinfo gère une bdd et est musicien

Tout est une question d'int...uition :D

Tout est une question d'int...uition 😀

Didacticiel :
Automatiser la récupération de données biologiques

Qui dit bioinformatique, dit récupération et manipulation des données. Ces données peuvent être générées à partir d'algorithmes ou bien récupérées depuis des bases de données biologiques. Aujourd'hui, le nombre de ces bases de données est en constante augmentation. Chaque mécanisme biologique, famille moléculaire ou organisme est associé à un ou plusieurs de ces dépôts de données...

Astuce :
L'annotation de régions génomiques et les analyses d’enrichissement

Les annotations sont essentielles lors d'analyses fonctionnelles à large échelle sur le génome. 
Lorsque l’on pratique des analyses en génomique, basées sur des techniques comme le RNA-seq ou le ChIP-seq, on se retrouve avec respectivement une liste de transcrits ou de pics (régions génomiques). Dans le cas des analyses ChIP-seq, on souhaite caractériser les gènes cibles du facteur de transcription étudié sur tout le génome (genome-wide), pour comprendre la fonction biologique de ce facteur...

Découverte :
Bioservices, un module Python très utile

Dans notre domaine si vaste, il existe de nombreuses bases de données (cf. Bases de données, notions par nahoy), et parmi ces bases, un certain nombre d'entre elles propose un service web pour accéder à leurs données à partir d'un script. Le problème principal qui peut nous freiner, ou nous faire peur, lorsque l'on se lance dans cette quête, c'est le nombre de services web dont nous devrons connaître la technologie...

Découverte :
Introduction aux ontologies

Qu'est-ce que c'est ?
Les ontologies telles qu'on les emploie en informatique (car le concept est philosophique avant tout) ont d'abord été mises au point pour l'intelligence artificielle. Leur objectif est de décrire ce qui existe et la définition formelle est assez complexe mais je vais m'efforcer de présenter les choses plus simplement.
Dans sa définition, une ontologie est un ensemble structuré de termes et de concepts d'un domaine particulier en précisant les relations entre ces termes et leurs propriétés...

J'ai lu :
J'ai lu : Bioinformatique, Cours et cas pratiques

Ce mois-ci, j'ai lu pour vous "Bioinfomatique, Cours et cas pratique," un ouvrage de Gilbert Deléage et Manolo Gouy, paru en 2013 aux éditions Dunod. Il s'agit d'un livre à destination des étudiants en licence et master qui souhaitent découvrir la bioinformatique des protéines du point de vue du biologiste. C'est donc un ouvrage très orienté outils et analyses.

Sujet
De nos jours, un biologiste souhaitant analyser des séquences de protéines nouvellement produites passera forcément par des outils bioinformatiques...

Découverte :
Jouez avec vos données : utilisez un ORM

Il y a quelques temps, je vous ai parlé de base de données, un super moyen pour structurer vos données.
Vous êtes maintenant j'en suis sûr, des professionnels du SELECT, des JOIN et autres ALTER. C'est bien, très bien même, mais maintenant je vais vous apprendre à vous en passer. Et oui, la ligne de commande c'est sympa pour des choses simples et/ou rapides, mais dès que vous voulez plus de complexité, il devient difficile de travailler sans un langage de plus haut niveau...

Astuce :
SQLite

Dans un précédent article, nous vous avons parlé des bases de données, leur importance et leur intérêt. Ici je vais vous parler de SQLite, une bibliothèque donnant accès à un moteur de base de données relationnelle qui vous permettra de travailler avec du SQL et cela sans avoir besoin de configurer ou d'installer quoi que ce soit: simple, rapide et efficace. Vous pouvez à loisir l'inclure dans tous vos projets, le code source de SQLite étant dans le domaine public...