Archives par tags: FASTA

Découverte :
Bioconvert - simplifier les conversions de formats

Bioconvert

Qui n'a jamais eu à convertir un fichier de données biologiques dans un autre format ? Il y a bien sur le classique fastq vers fasta, pour lequel nombre d'entre nous ont codé un convertisseur "maison", pas forcément optimal. D'autres formats sont parfois plus problématiques, par exemple la conversion vers et depuis GFF2/GFF3. De ces différents constats − convertisseurs "maison" (donc pas toujours parfaits), grande diversité de formats (parfois très complexes et peu documentés) nouveaux formats ou formats obsolètes, etc − est née l'idée de créer un outil de conversion dédié aux formats utilisés en bioinformatique : Bioconvert...

Astuce :
Astuce programmation BioPython : Parser les multi-genbank et les multi-FASTA produits par Batch Entrez

Prérequis : Savoir 'un peu' se servir d'un shell et avoir installé Python et son module Bio.
But : Redécouper des multi-genbank ou des multi-FASTA en un fichier par entrée.
Difficulté : 2/5 (Facile)
Principe : Le NCBI propose un outil très pratique pour récupérer facilement des jeux de données diversifiés : BatchEntrez, vous trouverez plus d'information ici. On télécharge ainsi un fichier texte unique réunissant toutes les données...

Astuce :
Récupérez facilement des données hébergées par le NCBI : BatchEntrez

But : Les bases de données du NCBI abritent de très nombreuses informations : génomes, protéines, références bibliographiques, etc. Si vous souhaitez récupérer l'une d'entre-elles, une recherche sur le site est la solution la plus simple, mais si vous avez besoin de récupérer de nombreuses données dans un des formats proposés, alors le NCBI a mis l'outil BatchEntrez à votre disposition...