Je découvre à l'instant genometools, un outil multifonction qui est capable de générer une image représentant des annotations sur un génome de référence. Idéal par exemple, si vous voulez vous passer d'un genome browser comme UCSC ou Ensembl pour incruster des images dans votre rapport.
Installation
Vous pouvez récupérer et compiler le code source depuis le site officiel. Pour ma part j'ai directement récupéré le binaire après un échec de compilation. Les binaires sont disponibles eux aussi sur le site.
1 2 3 4 5 |
wget http ://genometools.org/pub/binary_distributions/gt-1.5.9-Linux_x86_64-64bit-complete.tar.gz tar -zxvf gt-1.5.9-Linux_x86_64-64bit-complete.tar.gz ./gt-1.5.9-Linux_x86_64-64bit-complete/bin/gt –version |
Un exemple
La commande <gt sketch> génère une image à partir d'un fichier GFF3. C'est un fichier plus complet que le format BED qui contient pour chaque région à dessiner, la position de début et de fin ainsi que des informations complémentaires comme le sens et le nom de la région.
Essayons alors de dessiner quelques gènes à partir de Gencode. Il s'agit d'une base de données contenant la liste des gènes humains exportables au format GFF3.
1 2 3 4 5 6 7 8 9 10 11 |
# Téléchargement de genecode wget ftp ://ftp.sanger.ac.uk/pub/gencode/Gencode_human/release_25/GRCh37_mapping/gencode.v25lift37.annotation.gff3.gz # On récupère les 50 premières lignes gunzip -c gencode.v25lift37.annotation.gff3.gz | head -n50 > mes_genes.gff3 # On dessine nos gènes gt sketch output.png mes_genes.gff3 # On affiche notre image display output.png |
Résultats
On obtient alors cette jolie image. Cool, non ?
En Bref
Genometools est un outil très pratique si vous voulez intégrer ce genre de schéma dans vos rapports. Je ne l'ai pas testé entièrement, mais la documentation suggère bien plus de fonctionnalités. Libre à vous de tester et de faire vos retours dans les commentaires.
Merci au relecteur/testeur David Picard, Yoann M., Ludovic Roy et Yohan J..
Laisser un commentaire