Les identifiants : a (name)space oddity

Sur Bioinfo-fr.net, nous avons plusieurs fois parlé des bases de données biologiques. Que ce soit du point de vue de la gestion , de l’exploitation ou même du stockage physique . J’aimerai revenir aujourd’hui sur un souci qui se présente souvent lors de l’exploitation de plusieurs bases de données : les identifiants.

Un objet biologique dans une base de données est représenté par un identifiant. Cet identifiant est unique du point de vue de la base considérée. Mais comment faire le lien entre des identifiants venant de différentes bases de données ? Et surtout, comment être sûr qu’ils représentent bien le même objet biologique ?

clone_army_by_riser38-d5rnslr

by riser38 (CC BY-NC-ND 3.0)

Lire la suite


La complétion de réseaux métaboliques

Il y a quelques temps, sur ce blog, j’ai publié un article qui parlait de la reconstruction automatique de réseaux métaboliques à partir d’un génome annoté. Dans cet article je vous ai promis de continuer à parler de ce sujet, notamment pour voir comment l’on pouvait améliorer la qualité d’un réseau métabolique fraichement créé. Pour rappel, la toute première reconstruction d’un réseau métabolique est habituellement de qualité variable, directement dépendant de la qualité de l’annotation du génome, que l’on appelle « draft métabolique ». Un génome n’étant jamais annoté parfaitement et les bases de données ne pouvant recenser toutes les réactions métaboliques existantes, ce draft métabolique comportera toujours des trous, des inexactitudes, etc.
Dans cet article je vais donc revenir plus en détail sur la manière dont on peut combler ces trous et ainsi améliorer le réseau .

Lire la suite


Reconstruction automatique de réseaux métaboliques

Le nombre de génomes séquencés croît aujourd’hui exponentiellement. Il est probable que d’ici peu de temps chacun d’entre nous puisse avoir la séquence de son propre génome pour une poignée de dollars en quelques jours seulement. On peut d’ailleurs se référer à ce récent débat vidéo , dans lequel intervient notamment le professeur Denis Duboule (généticien à l’École Polytechnique Fédérale de Lausanne), pour avoir plus d’informations au sujet des séquençages haut débit, des risques que cela comporte pour chacun d’entre nous, des précautions à prendre vis-à-vis du « tout séquençage ».

Du point de vue de la recherche, de très nombreux organismes sont aujourd’hui séquencés à la chaîne. Ces séquençages haut débit apportent une quantité d’information énorme qu’il convient ensuite d’étudier, et notamment une information sur le métabolisme d’un organisme via l’identification des enzymes présentes dans les cellules. Et la reconstruction de réseaux métaboliques (n’ayez crainte, je vous expliquerais plus loin de quoi il s’agit) est un excellent moyen de prendre en compte cette grande quantité d’information.

Lire la suite