Archives par tags: tutoriel

Didacticiel :
Inkscape pour biologistes

Fini les rectangles pour faire des protéines ou les images pixelisées chopées sur des sites douteux !
Dans 10 minutes vous serez un pro d'Inkscape qui est un logiciel gratuit pour "dessiner" avec une prise en main très rapide permettant de réaliser des figures vectorielles, non construites en pixels, pouvant être alors redimensionnées à l'infini en conservant toutes leurs qualités visuelles...

Opinion :
Les commandements du stagiaire en bioinformatique

La période des stages n'est pas loin et toi, jeune étudiant(e) bioinformaticien(ne) - futur(e) stagiaire, te demandes comment choisir parmi toutes ces annonces. Pas de panique, c'est tout à fait normal de se poser toute une ribambelle de questions, nous y sommes tous passés. La bonne nouvelle c'est que c'est ton jour de chance : les réponses se trouvent (normalement) dans ce billet.
À la recherche du stage : Motivation, mon amie

La première des choses à cocher dans ta checklist c'est la motivation...

Didacticiel :
Jouer avec l'API de KEGG

Il n'est pas rare que nous ayons un jour besoin de récupérer des informations de la base de données KEGG (Kyoto Encyclopedia of Genes and Genomes). Cette base de données fournit un nombre conséquent d'informations sur les génomes et les réseaux de gènes mais également sur les voies métaboliques ou les maladies. Dans ces cas là, bien souvent, nous passons directement par le site internet à l'adresse http://www...

Didacticiel :
"IRC ? Mais c'est quoi en fait ?"

Cette question, je l'entends maintenant depuis pas mal de temps quand je parle du blog à mon entourage (étudiants de mon ex-master, personnes rencontrées aux JeBiF Pubs et TOBi, collègues, bioinformaticiens croisés, etc.). C'en est arrivé au point que je me sens vieille je me suis dit que faire un article de présentation de cet outil qu'est IRC, adjoint d'un mini tutoriel serait une bonne idée...

Didacticiel :
Packrat ou comment gérer ses packages R par projet

Qui ne s'est jamais retrouvé coincé entre deux projets R utilisant deux versions différentes d'un même package ?
Qui n'a jamais eu cette idée folle, un jour d'inventer un cas d'école (via R) qu'il souhaitait partager ?
Qui n'a jamais eu à chercher quelle version de package est nécessaire avec un code récupéré d'un collègue pour qu'il fonctionne comme celui du dit collègue ?
Qui n'a jamais installé nombre de packages dans sa librairie pour divers projets et n'a jamais osé les désinstaller par peur que des projets ne fonctionnent plus ?
Qui n'a jamais mis à jour un package dans un projet pour qu'il fonctionne, et ainsi cessé de faire fonctionner un autre projet ?
Qui n'a jamais mis à jour par erreur un package et involontairement TOUTES ses dépendances avec la même conséquence que ci-dessus ?

 
Je vais m'arrêter là, je pense que vous avez compris que la gestion de packages sous R est une source d'erreurs faciles...

Didacticiel :
Automatiser la récupération de données biologiques : version avancée

Dans cette version avancée, nous allons nous intéresser à une autre manière de récupérer des données depuis un site internet : via l'utilisation de formulaires.
Les formulaires, ce sont ces pages avec plein de champs à remplir et que vous soumettez ensuite pour vous créer un compte, contacter votre hotline ou que sais-je. Leur utilisation permet de contourner une limitation importante de la soumission d'informations via des adresses internet (ou URL pour "Uniform Resource Locator") : le volume de données (au fait, saviez-vous qu'un Geek ne crie pas, mais qu'il URL? ;-))...

Didacticiel :
Snakemake aller plus loin avec la parallélisation

Bonjour à tous, bienvenue dans un nouvel épisode de tutoriels sur Snakemake (épisode précédent).
Aujourd'hui nous allons voir ensemble comment paralléliser facilement par la donnée grâce à Snakemake. L'idée générale consiste à découper les fichiers bruts au début de notre pipeline et de les rassembler après les étapes lourdes en calcul.

Nous allons également voir comment utiliser le fichier de configuration au format Json...

Découverte :
Champs de force, énergie potentielle et autres joyeusetés en modélisation moléculaire

Introduction
Cet article, d'une très longue série, a pour but de donner plus de détails et peut-être - qui sait - vous titiller suffisamment pour enjamber la barrière physique (au sens littéral) et rejoindre le fabuleux monde d'Oz de la bioinformatique structurale.
Avant de commencer, je vous conseille de prendre du papier, un crayon, un thé ou un café. Ces breuvages serviront à illustrer mes exemples et faire une pause dans votre lecture...

Didacticiel :
Automatiser la récupération de données biologiques

Qui dit bioinformatique, dit récupération et manipulation des données. Ces données peuvent être générées à partir d'algorithmes ou bien récupérées depuis des bases de données biologiques. Aujourd'hui, le nombre de ces bases de données est en constante augmentation. Chaque mécanisme biologique, famille moléculaire ou organisme est associé à un ou plusieurs de ces dépôts de données...

Astuce :
Snakemake pour les nuls (ou comment créer un pipeline facilement ?)

Bonjour à tous, et bienvenue dans le premier épisode d'une (longue ?) série de prise en main de l'outil dédié au pipeline : Snakemake.
Si vous ne connaissez pas encore cet outil, c'est que vous êtes sûrement passés à côté de cet article écrit par Nisaea. Alors, quel sera les bénéfices de retranscrire vos pipelines déjà tout prêt en Snakefile ?
Lisibilité du code, gestion des ressources et reproductibilité

Lorsque vous êtes sur le point de publier,  il va bien falloir expliquer aux futurs lecteurs comment vous avez obtenu les résultats...