- Le blog participatif de bioinformatique francophone depuis 2012 -

Étiquette : NCBI

  • Les bases de données de séquençage : GEO, SRA, ENA, ArrayExpress

    Les bases de données de séquençage : GEO, SRA, ENA, ArrayExpress

    De nos jours, lors de la publi­ca­tion de résul­tats, il est néces­saire de rendre public les éven­tuelles don­nées de séquen­çage géné­rées. Si un faible nombre d’irréductibles conti­nuent à ne four­nir les don­nées que sur demande, les bonnes pra­tiques poussent à les dépo­ser dans des bases de don­nées libre­ment acces­sibles. Quatre grandes bases de don­nées de séquen­çage…

  • Le site du NCBI "un peu" plus moderne grâce aux extensions de navigateurs

    Le site du NCBI "un peu" plus moderne grâce aux extensions de navigateurs

    « Pour la semaine pro­chaine vous allez devoir trou­ver et étu­dier l’article sur le site du NCBI [insé­rer un nom bien com­pli­qué ici] » Pas­sée la décep­tion d’avoir à se plon­ger dans un article obs­cur en anglais, on ouvre l’article en ques­tion et là… on découvre un énorme pavé de texte ma foi fort inté­res­sant mais…

  • L'analyse de données RNA-seq : mode d'emploi

    L'analyse de données RNA-seq : mode d'emploi

    Un jour, un bio­lo­giste se pointe chez vous avec d'une part un disque dur externe dans la main, d'autre part l'air sou­cieux. Il veut que vous ana­ly­siez ses don­nées RNA-seq. Le disque, c'est parce qu'il a envi­ron 50Gb de don­nées à vous trans­mettre ; l'air sou­cieux, c'est parce qu'elles ont coû­té dans les 15'000 euros, et…

  • Chercher des motifs dans un fichier

    Chercher des motifs dans un fichier

    Lan­gage : shellCom­mandes pré­sen­tées : grep, split (suc­cin­te­ment)Niveau : débu­tant Présentation de la commande grep La com­mande grep est dis­po­nible nati­ve­ment sur la plu­part des sys­tèmes d'exploitation GNU/​Linux. La plu­part des uti­li­sa­teurs uti­lisent cette com­mande pour recher­cher un mot ou un groupe de mots, que nous appel­le­rons motif (pat­tern en anglais), dans un fichier texte. Cepen­dant cette com­mande…

  • Astuce programmation BioPython : Parser les multi-genbank et les multi-FASTA produits par Batch Entrez

    Pré­re­quis : Savoir 'un peu' se ser­vir d'un shell et avoir ins­tal­lé Python et son module Bio. But : Redé­cou­per des mul­ti-gen­bank ou des mul­ti-FAS­TA en un fichier par entrée. Dif­fi­cul­té : 2/​5 (Facile) Prin­cipe : Le NCBI pro­pose un outil très pra­tique pour récu­pé­rer faci­le­ment des jeux de don­nées diver­si­fiés : Bat­chEn­trez, vous trou­ve­rez plus d'information ici. On télé­charge ain­si un…

  • Récupérez facilement des données hébergées par le NCBI : BatchEntrez

    Récupérez facilement des données hébergées par le NCBI : BatchEntrez

    But : Les bases de don­nées du NCBI abritent de très nom­breuses infor­ma­tions : génomes, pro­téines, réfé­rences biblio­gra­phiques, etc. Si vous sou­hai­tez récu­pé­rer l'une d'entre-elles, une recherche sur le site est la solu­tion la plus simple, mais si vous avez besoin de récu­pé­rer de nom­breuses don­nées dans un des for­mats pro­po­sés, alors le NCBI a mis l'outil…

  • Récupérer la fiche d'un gène avec les Eutils du NCBI

    En bio­in­for­ma­tique il n'est pas rare que l'on ait besoin d’accéder à des infor­ma­tions dis­po­nibles sur des bases de don­nées inter­na­tio­nales, nous ver­rons ici le cas de la banque Gene du NCBI. Avant de s'intéresser à la récu­pé­ra­tion d'une fiche d'un gène en pas­sant par les Eutils, un peu de théo­rie et d'explications sur une fiche…