Archives par tags: tutoriel

Didacticiel :
Packrat ou comment gérer ses packages R par projet

Qui ne s'est jamais retrouvé coincé entre deux projets R utilisant deux versions différentes d'un même package ?
Qui n'a jamais eu cette idée folle, un jour d'inventer un cas d'école (via R) qu'il souhaitait partager ?
Qui n'a jamais eu à chercher quelle version de package est nécessaire avec un code récupéré d'un collègue pour qu'il fonctionne comme celui du dit collègue ?
Qui n'a jamais installé nombre de packages dans sa librairie pour divers projets et n'a jamais osé les désinstaller par peur que des projets ne fonctionnent plus ?
Qui n'a jamais mis à jour un package dans un projet pour qu'il fonctionne, et ainsi cessé de faire fonctionner un autre projet ?
Qui n'a jamais mis à jour par erreur un package et involontairement TOUTES ses dépendances avec la même conséquence que ci-dessus ?

 
Je vais m'arrêter là, je pense que vous avez compris que la gestion de packages sous R est une source d'erreurs faciles...

Didacticiel :
Automatiser la récupération de données biologiques : version avancée

Dans cette version avancée, nous allons nous intéresser à une autre manière de récupérer des données depuis un site internet : via l'utilisation de formulaires.
Les formulaires, ce sont ces pages avec plein de champs à remplir et que vous soumettez ensuite pour vous créer un compte, contacter votre hotline ou que sais-je. Leur utilisation permet de contourner une limitation importante de la soumission d'informations via des adresses internet (ou URL pour "Uniform Resource Locator") : le volume de données (au fait, saviez-vous qu'un Geek ne crie pas, mais qu'il URL? ;-))...

Didacticiel :
Snakemake aller plus loin avec la parallélisation

Bonjour à tous, bienvenue dans un nouvel épisode de tutoriels sur Snakemake (épisode précédent).
Aujourd'hui nous allons voir ensemble comment paralléliser facilement par la donnée grâce à Snakemake. L'idée générale consiste à découper les fichiers bruts au début de notre pipeline et de les rassembler après les étapes lourdes en calcul.

Nous allons également voir comment utiliser le fichier de configuration au format Json...

Découverte :
Champs de force, énergie potentielle et autres joyeusetés en modélisation moléculaire

Introduction
Cet article, d'une très longue série, a pour but de donner plus de détails et peut-être - qui sait - vous titiller suffisamment pour enjamber la barrière physique (au sens littéral) et rejoindre le fabuleux monde d'Oz de la bioinformatique structurale.
Avant de commencer, je vous conseille de prendre du papier, un crayon, un thé ou un café. Ces breuvages serviront à illustrer mes exemples et faire une pause dans votre lecture...

Didacticiel :
Automatiser la récupération de données biologiques

Qui dit bioinformatique, dit récupération et manipulation des données. Ces données peuvent être générées à partir d'algorithmes ou bien récupérées depuis des bases de données biologiques. Aujourd'hui, le nombre de ces bases de données est en constante augmentation. Chaque mécanisme biologique, famille moléculaire ou organisme est associé à un ou plusieurs de ces dépôts de données...

Astuce :
Snakemake pour les nuls (ou comment créer un pipeline facilement ?)

Bonjour à tous, et bienvenue dans le premier épisode d'une (longue ?) série de prise en main de l'outil dédié au pipeline : Snakemake.
Si vous ne connaissez pas encore cet outil, c'est que vous êtes sûrement passés à côté de cet article écrit par Nisaea. Alors, quel sera les bénéfices de retranscrire vos pipelines déjà tout prêt en Snakefile ?
Lisibilité du code, gestion des ressources et reproductibilité
Snake | Crystal Sanchez
Lorsque vous êtes sur le point de publier,  il va bien falloir expliquer aux futurs lecteurs comment vous avez obtenu les résultats...

Didacticiel :
Comment faire de Sozi présentations avec inkscape

Vous avez sûrement vu le billet sur inkscape écrit par Zazo0o. Maintenant que vous avez franchi le pas et que vous maîtrisez cet outil, nous allons voir qu'il est également possible de créer des présentations dynamiques grâce au plugin Sozi (qui est en plus développé par des français "cocorico").
Les auteurs ont arrêté le développement du plugin Sozi pour inkscape pour se concentrer sur une version standalone...

Didacticiel :
Python, dessine-moi un graphe

Derrière ce titre énigmatique, qui n'aura pas été sans vous rappeler la fameuse phrase du Petit Prince d'Antoine de Saint Exupéry, se cache un module pour Python qui dira sûrement quelque chose à nos lecteurs assidus spécialisés dans les graphes : pygraphviz !
Ce module a été créé autour de GraphViz et vous permet ainsi de faire des graphes sous Python en respectant les normes établies par GraphViz et, par conséquent, d'exporter ou d'importer très facilement vos graphes pour vos différents projets...

Découverte :
Twitter, arme de communication massive et outil scientifique

CC-BY Jonathan Sobel
Twitter est un réseau social incontournable. Son principe est simple, il s'agit de s'échanger avec ses "followers", des messages ou "tweets" de 140 charactères maximum. Il est surtout utilisé aux Etats-Unis, mais la fièvre Twitter gagne peu à peu l'Europe.  De nombreux scientifiques, chefs de labos, doctorants et même des institutions informent par ce biais. En créant votre compte vous pourrez avoir un accès direct à toutes ces personnes (en tant que suiveur) et vous pourrez leur poser des questions au moyen de messages directs (DM)...

Didacticiel :
De la procrastination dans l'R

Connaissances requises

Connaissances basiques en R. Si vous ne faites pas la différence entre un test exact de Fisher et le test du Chi-2, cela ne devrait pas poser de problème.
Euh, bah c'est tout !

Introduction
Si l'on s'en réfère à la définition :
Un informaticien, et a fortiori un bioinformaticien, fera tout pour mettre en œuvre des stratégies lui permettant d'automatiser les tâches répétitives qui lui incombe...