Dessiner vos gènes à partir d'un GFF3

Je découvre à l'instant geno­me­tools, un outil mul­ti­fonc­tion qui est capable de géné­rer une image repré­sen­tant des anno­ta­tions sur un génome de réfé­rence. Idéal par exemple, si vous vou­lez vous pas­ser d'un genome brow­ser comme UCSC ou Ensem­bl pour incrus­ter des images dans votre rap­port.

Installation

Vous pou­vez récu­pé­rer et com­pi­ler le code source depuis le site offi­ciel. Pour ma part j'ai direc­te­ment récu­pé­ré le binaire après un échec de com­pi­la­tion. Les binaires sont dis­po­nibles eux aus­si sur le site.


wget http://genometools.org/pub/binary_distributions/gt-1.5.9-Linux_x86_64-64bit-complete.tar.gz
tar -zxvf gt-1.5.9-Linux_x86_64-64bit-complete.tar.gz
./gt-1.5.9-Linux_x86_64-64bit-complete/bin/gt --version

Un exemple

La commande <gt sketch> génère une image à partir d'un fichier GFF3. C'est un fichier plus complet que le format BED qui contient pour chaque région à dessiner, la position de début et de fin ainsi que des informations complémentaires comme le sens et le nom de la région.
Essayons alors de dessiner quelques gènes à partir de Gencode. Il s'agit d'une base de données contenant la liste des gènes humains exportables au format GFF3.

 # Téléchargement de genecode
wget ftp://ftp.sanger.ac.uk/pub/gencode/Gencode_human/release_25/GRCh37_mapping/gencode.v25lift37.annotation.gff3.gz
# On récupère les 50 premières lignes
gunzip -c gencode.v25lift37.annotation.gff3.gz|head -n50 > mes_genes.gff3
# On dessine nos gènes
gt sketch output.png mes_genes.gff3
# On affiche notre image
display output.png

Résultats

On obtient alors cette jolie image. Cool, non ?

En Bref

Genometools est un outil  très pratique si vous voulez intégrer ce genre de schéma dans vos rapports. Je ne l'ai pas testé entièrement, mais la documentation suggère bien plus de fonctionnalités. Libre à vous de tester et de faire vos retours dans les commentaires.

 

Merci au relecteur/testeur David Picard, Yoann M., Ludovic Roy et Yohan J..

 



Pour continuer la lecture :


Commentaires

3 réponses à “Dessiner vos gènes à partir d'un GFF3”

  1. Sym­pa comme trou­vaille. 🙂

    Moi qui suis nul en bash, com­ment géné­rer une image de son gène pré­fé­ré et des ses alen­tours quand on a que son nom et un gros GFF ?

    En gros, com­ment rem­pla­cer :

    gun­zip ‑c gencode.v25lift37.annotation.gff3.gz | head ‑n50 > mes_genes.gff3

    Par un truc qui prend le nom de gènes et crache toute les lignes de ce gène +/- 10kb autours ?

  2. Hel­lo, un lien dans l'intro semble mort :

    UCSC

    Bien à vous,
    Chaoui

    1. C'est cor­ri­gé, mer­ci !

Laisser un commentaire