Catégorie : Astuce
-
Récupérez facilement des données hébergées par le NCBI : BatchEntrez
But : Les bases de données du NCBI abritent de très nombreuses informations : génomes, protéines, références bibliographiques, etc. Si vous souhaitez récupérer l'une d'entre-elles, une recherche sur le site est la solution la plus simple, mais si vous avez besoin de récupérer de nombreuses données dans un des formats proposés, alors le NCBI a mis l'outil…
-
Comment travailler sur une grappe de serveurs (cluster)
Avec les avancées en biologie ces dernières années, la quantité de données produites et les ressources informatiques nécessaires à leur traitement ont grandement augmenté. Pour faire face à ces problèmes, l'une des solutions les plus répandues est la mise en place de grappes de serveurs (plus souvent désignées par le terme anglais computer cluster ou…
-
Command line Tips : passage de variable dans awk
But : Dans un fichier organisé en colonnes, nous allons extraire les lignes contenant un mot (donné en argument) dans une colonne fixée à l'avance (1ère colonne). Prérequis : Connaître un peu le shell (pour l'exercice). Difficulté : 2/5 (Facile) Exercice : Pour agrémenter la note, on extraira dans quatre fichiers distincts les lignes contenant les quatre mots les…
-
Data Visualisation ou l'art de se faire comprendre
De nos jours il faut comprendre et se faire comprendre vite et bien. Une bonne présentation, un bon article ou bien un bon poster se distingue non seulement par un contenu pertinent mais aussi par des illustrations efficaces. On peut avoir la meilleure idée du monde, si on ne sait pas la mettre en valeur…
-
SQL Tips : Les transactions
But : Comprendre ce qu'est une transaction au sens SQL du terme, savoir l'utiliser : les avantages, les limitations. J'aborderai superficiellement la notion de degré d'isolation. Prérequis : Savoir faire des requêtes. Difficulté : 1 (Facile) Tout d'abord une définition volontairement simple : une transaction est un ensemble d'une ou plusieurs requêtes SQL regroupées au sein d'un bloc qui est…
-
Commandline Tips : Extraction du x‑ième champ d'un fichier organisé en colonne
But : Dans un fichier organisé en colonne, extraire la (ou les) colonne(s) qui nous intéressent Prérequis : Savoir utiliser grep est un plus. Difficulté : 1/5 (Facile) Nous souhaitons dans le fichier PDB 6CSC extraire la première et la quatrième colonne des lignes débutant par le mot clef "ATOM" Préparation des données : La première chose à faire…
-
Galaxy : Bien plus qu'un gestionnaire de workflows
Qu'est-ce que Galaxy ? Galaxy est une application web écrite en Python destinée à faciliter la manipulation et l'analyse des données, dans le cadre de la recherche biomédicale. Elle permet d'utiliser des logiciels habituellement exécutés en ligne de commande de manière graphique, grâce à un système de plugins (« outils ») en XML et de templates Mako. Ces…