- Le blog participatif de bioinformatique francophone depuis 2012 -

Étiquette : base de données

  • Les bases de données de séquençage : GEO, SRA, ENA, ArrayExpress

    Les bases de données de séquençage : GEO, SRA, ENA, ArrayExpress

    De nos jours, lors de la publi­ca­tion de résul­tats, il est néces­saire de rendre public les éven­tuelles don­nées de séquen­çage géné­rées. Si un faible nombre d’irréductibles conti­nuent à ne four­nir les don­nées que sur demande, les bonnes pra­tiques poussent à les dépo­ser dans des bases de don­nées libre­ment acces­sibles. Quatre grandes bases de don­nées de séquen­çage…

  • Jouer avec l'API de KEGG

    Jouer avec l'API de KEGG

    Il n'est pas rare que nous ayons un jour besoin de récu­pé­rer des infor­ma­tions de la base de don­nées KEGG (Kyo­to Ency­clo­pe­dia of Genes and Genomes). Cette base de don­nées four­nit un nombre consé­quent d'informations sur les génomes et les réseaux de gènes mais éga­le­ment sur les voies méta­bo­liques ou les mala­dies. Dans ces cas…

  • Automatiser la récupération de données biologiques

    Automatiser la récupération de données biologiques

    Qui dit bio­in­for­ma­tique, dit récu­pé­ra­tion et mani­pu­la­tion des don­nées. Ces don­nées peuvent être géné­rées à par­tir d'algorithmes ou bien récu­pé­rées depuis des bases de don­nées bio­lo­giques. Aujourd'hui, le nombre de ces bases de don­nées est en constante aug­men­ta­tion. Chaque méca­nisme bio­lo­gique, famille molé­cu­laire ou orga­nisme est asso­cié à un ou plu­sieurs de ces dépôts de don­nées. Si un…

  • L'annotation de régions génomiques et les analyses d’enrichissement

    L'annotation de régions génomiques et les analyses d’enrichissement

    Les anno­ta­tions sont essen­tielles lors d'analyses fonc­tion­nelles à large échelle sur le génome.  Lorsque l’on pra­tique des ana­lyses en géno­mique, basées sur des tech­niques comme le RNA-seq ou le ChIP-seq, on se retrouve avec res­pec­ti­ve­ment une liste de trans­crits ou de pics (régions géno­miques). Dans le cas des ana­lyses ChIP-seq, on sou­haite carac­té­ri­ser les gènes cibles du fac­teur…

  • Bioservices, un module Python très utile

    Bioservices, un module Python très utile

    Dans notre domaine si vaste, il existe de nom­breuses bases de don­nées (cf. Bases de don­nées, notions par nahoy), et par­mi ces bases, un cer­tain nombre d'entre elles pro­pose un ser­vice web pour accé­der à leurs don­nées à par­tir d'un script. Le pro­blème prin­ci­pal qui peut nous frei­ner, ou nous faire peur, lorsque l'on se…

  • Introduction aux ontologies

    Introduction aux ontologies

    Qu'est-ce que c'est ? Les onto­lo­gies telles qu'on les emploie en infor­ma­tique (car le concept est phi­lo­so­phique avant tout) ont d'abord été mises au point pour l'intelligence arti­fi­cielle. Leur objec­tif est de décrire ce qui existe et la défi­ni­tion for­melle est assez com­plexe mais je vais m'efforcer de pré­sen­ter les choses plus sim­ple­ment. Dans sa défi­ni­tion,…

  • J'ai lu : Bioinformatique, Cours et cas pratiques

    J'ai lu : Bioinformatique, Cours et cas pratiques

    Ce mois-ci, j'ai lu pour vous "Bioin­fo­ma­tique, Cours et cas pra­tique," un ouvrage de Gil­bert Deléage et Mano­lo Gouy, paru en 2013 aux édi­tions Dunod. Il s'agit d'un livre à des­ti­na­tion des étu­diants en licence et mas­ter qui sou­haitent décou­vrir la bio­in­for­ma­tique des pro­téines du point de vue du bio­lo­giste. C'est donc un ouvrage très…

  • Jouez avec vos données : utilisez un ORM

    Il y a quelques temps, je vous ai par­lé de base de don­nées, un super moyen pour struc­tu­rer vos don­nées. Vous êtes main­te­nant j'en suis sûr, des pro­fes­sion­nels du SELECT, des JOIN et autres ALTER. C'est bien, très bien même, mais main­te­nant je vais vous apprendre à vous en pas­ser. Et oui, la ligne de…