Catégorie : Astuce

  • Astuce programmation BioPython : Parser les multi-genbank et les multi-FASTA produits par Batch Entrez

    Pré­re­quis : Savoir 'un peu' se ser­vir d'un shell et avoir ins­tal­lé Python et son module Bio. But : Redé­cou­per des mul­ti-gen­bank ou des mul­ti-FAS­TA en un fichier par entrée. Dif­fi­cul­té : 2/​5 (Facile) Prin­cipe : Le NCBI pro­pose un outil très pra­tique pour récu­pé­rer faci­le­ment des jeux de don­nées diver­si­fiés : Bat­chEn­trez, vous trou­ve­rez plus d'information ici. On télé­charge ain­si un…

  • Récupérez facilement des données hébergées par le NCBI : BatchEntrez

    Récupérez facilement des données hébergées par le NCBI : BatchEntrez

    But : Les bases de don­nées du NCBI abritent de très nom­breuses infor­ma­tions : génomes, pro­téines, réfé­rences biblio­gra­phiques, etc. Si vous sou­hai­tez récu­pé­rer l'une d'entre-elles, une recherche sur le site est la solu­tion la plus simple, mais si vous avez besoin de récu­pé­rer de nom­breuses don­nées dans un des for­mats pro­po­sés, alors le NCBI a mis l'outil…

  • Comment travailler sur une grappe de serveurs (cluster)

    Comment travailler sur une grappe de serveurs (cluster)

    Avec les avan­cées en bio­lo­gie ces der­nières années, la quan­ti­té de don­nées pro­duites et les res­sources infor­ma­tiques néces­saires à leur trai­te­ment ont gran­de­ment aug­men­té. Pour faire face à ces pro­blèmes, l'une des solu­tions les plus répan­dues est la mise en place de grappes de ser­veurs (plus sou­vent dési­gnées par le terme anglais com­pu­ter clus­ter ou…

  • Command line Tips : passage de variable dans awk

    Command line Tips : passage de variable dans awk

    But : Dans un fichier orga­ni­sé en colonnes, nous allons extraire les lignes conte­nant un mot (don­né en argu­ment) dans une colonne fixée à l'avance (1ère colonne). Pré­re­quis : Connaître un peu le shell (pour l'exercice). Dif­fi­cul­té : 2/​5 (Facile) Exer­cice : Pour agré­men­ter la note, on extrai­ra dans quatre fichiers dis­tincts les lignes conte­nant les quatre mots les…

  • Data Visualisation ou l'art de se faire comprendre

    Data Visualisation ou l'art de se faire comprendre

    De nos jours il faut com­prendre et se faire com­prendre vite et bien. Une bonne pré­sen­ta­tion, un bon article ou bien un bon pos­ter se dis­tingue non seule­ment par un conte­nu per­ti­nent mais aus­si par des illus­tra­tions effi­caces. On peut avoir la meilleure idée du monde, si on ne sait pas la mettre en valeur…

  • SQL Tips : Les transactions

    SQL Tips : Les transactions

    But : Com­prendre ce qu'est une tran­sac­tion au sens SQL du terme, savoir l'utiliser : les avan­tages, les limi­ta­tions. J'aborderai super­fi­ciel­le­ment la notion de degré d'isolation. Pré­re­quis : Savoir faire des requêtes. Dif­fi­cul­té : 1 (Facile) Tout d'abord une défi­ni­tion volon­tai­re­ment simple : une tran­sac­tion est un ensemble d'une ou plu­sieurs requêtes SQL regrou­pées au sein d'un bloc qui est…

  • Trouver un emploi/​une thèse en bioinformatique : quelques pistes

    Trouver un emploi/​une thèse en bioinformatique : quelques pistes

    Par­mi les lec­teurs de Bioin­fo-fr, il y a très pro­ba­ble­ment des étu­diants de M2 qui, absor­bés par leur stage de fin d'année, n'ont pas encore vrai­ment réflé­chi à ce qu'ils vou­draient faire à la ren­trée ; des thé­sards dont la sou­te­nance approche et qui aime­raient faire un post-doc à l'étranger ; ou encore des ingé­nieurs dont le…

  • Commandline Tips : Extraction du x‑ième champ d'un fichier organisé en colonne

    But : Dans un fichier orga­ni­sé en colonne, extraire la (ou les) colonne(s) qui nous inté­ressent Pré­re­quis : Savoir uti­li­ser grep est un plus. Dif­fi­cul­té : 1/​5 (Facile) Nous sou­hai­tons dans le fichier PDB 6CSC  extraire la pre­mière et la qua­trième colonne des lignes débu­tant par le mot clef "ATOM" Pré­pa­ra­tion des don­nées : La pre­mière chose à faire…

  • Galaxy : Bien plus qu'un gestionnaire de workflows

    Galaxy : Bien plus qu'un gestionnaire de workflows

    Qu'est-ce que Galaxy ? Galaxy est une appli­ca­tion web écrite en Python des­ti­née à faci­li­ter la mani­pu­la­tion et l'analyse des don­nées, dans le cadre de la recherche bio­mé­di­cale. Elle per­met d'utiliser des logi­ciels habi­tuel­le­ment exé­cu­tés en ligne de com­mande de manière gra­phique, grâce à un sys­tème de plu­gins (« outils ») en XML et de tem­plates Mako. Ces…