Archives par tags: script

Didacticiel :
Jouer avec l'API de KEGG

Logo de la Kyoto Encyclopedia of Genes and Genomes (KEGG), propriété intellectuelle de Kanehisa Laboratories.
Il n'est pas rare que nous ayons un jour besoin de récupérer des informations de la base de données KEGG (Kyoto Encyclopedia of Genes and Genomes). Cette base de données fournit un nombre conséquent d'informations sur les génomes et les réseaux de gènes mais également sur les voies métaboliques ou les maladies...

Suivez l'guide :
Ajoutez une interface graphique à votre script en 4 lignes avec Gooey

Vous venez de terminer votre analyse bio-informatique. Pour cette dernière, vous avez réalisé un script qui pour l'instant, il faut le dire, n'est pas du tout réutilisable par une tierce personne. Même vous dans 6 mois vous n'êtes pas sûr de vous souvenir de ce que vous avez fait. Pourtant, l'un des intérêts de la programmation est de pouvoir répéter des calculs de manière automatique. Par conséquent, ce serait pratique de rendre votre script un peu plus souple afin de ne pas devoir modifier son code source à chaque fois qu'un paramètre de votre analyse change...

Didacticiel :
Parser des fichiers HTML en Python

I can haz HTML (CC-BY Tomomi)
Langage : Python
Bibliothèques : bioservices, HTMLParser, re (partiellement)
Niveau : débutant-intermédiaire
Dans un article précédent, je vous ai présenté le module bioservices en Python. Au cours de mon travail j'ai été amenée à récupérer des informations sur les termes Gene Ontology, et notamment sur les relations entre différents termes. Cependant, les formats de fichiers récupérés sont différents en fonction des données qu'ils renferment...

Découverte :
Bioservices, un module Python très utile

Logo officiel du langage de programmation Python |Tous droits réservés
Dans notre domaine si vaste, il existe de nombreuses bases de données (cf. Bases de données, notions par nahoy), et parmi ces bases, un certain nombre d'entre elles propose un service web pour accéder à leurs données à partir d'un script. Le problème principal qui peut nous freiner, ou nous faire peur, lorsque l'on se lance dans cette quête, c'est le nombre de services web dont nous devrons connaître la technologie...

Astuce :
Astuce : ajouter des options dans un script Bash avec getopt

But : comprendre le fonctionnement de getopt en Bash pour éviter la multiplications de script là où un seul générique pourrait suffire.
Prérequis : savoir faire des scripts Bash, connaître la substitution de commande et savoir manipuler les arguments.
Difficulté : 2 (moyen)
Pour ceux qui codent en Perl, vous connaissez déjà sûrement le module GetOpt et plus particulièrement son extension GetOpt::Long (ou encore le module getopt du langage Python)...

Découverte :
À la découverte de BioMart !

Dans le cadre de mon travail, j'ai récemment découvert un outil formidable pour la consultation et la récupération de données à partir de certaines banques : BioMart.
Logo de BioMart. Image du domaine public
Après avoir passé la frustration de devoir utiliser l'interface du service fourni pour télécharger les différentes données dont j'avais besoin, je me suis renseignée davantage sur ce logiciel...

Découverte :
Récupérer la fiche d'un gène avec les Eutils du NCBI

En bioinformatique il n'est pas rare que l'on ait besoin d’accéder à des informations disponibles sur des bases de données internationales, nous verrons ici le cas de la banque Gene du NCBI. Avant de s'intéresser à la récupération d'une fiche d'un gène en passant par les Eutils, un peu de théorie et d'explications sur une fiche type s'impose.
Pourquoi choisir d'utiliser les Eutils ?
Bien qu'il soit possible de jouer avec la construction d'une URL afin de récupérer la fiche d'un gène au format texte ou XML directement sur le serveur officiel, le NCBI préconise plutôt l'utilisation du serveur Eutils, qui est un outil dédié à l'exécution massive externe de ce genre de requête...

Astuce :
Transformer une sortie de Blast xml en format GenBank

Bonjour, et bienvenu dans mon premier article concernant mon script Perl Blast2Gb.pl. Ce dernier illustre parfaitement ce qu'on peut faire facilement et rapidement avec un script Perl : du traitement de texte. Cet outil permet de faciliter la vie et de transformer une tâche laborieuse en un traitement rapide et efficace.
En effet, qui ne s'est jamais retrouvé avec une sortie de BLAST qu'il voudrait regarder dans un programme de visualisation de séquences (comme Geneious par exemple) mais qui ne prend pas les sorties de BLAST ? Ou encore, devant soumettre un génome au NCBI, mais qui n'a pas envie de se taper tout le formatage à la main ? Eh bien, mon programme est là pour prendre une sortie xml d'un blastn, blastx, tblastn ou tblastx et la transformer en une sortie ...