Archives par tags: visualisation

Astuce :
Créer des Heatmaps à partir de grosses matrices en R

En génomique, et sans doute dans tout un tas d'autres domaines omiques ou big data, nous essayons souvent de tracer des grosses matrices sous forme d'heatmap. Par grosse matrice, j'entends une matrice dont le nombre de lignes et/ou de colonnes est plus grand que le nombre de pixels sur l'écran que vous utilisez. Par exemples, si vous avez une matrice de 50 colonnes et de 20 000 lignes (cas assez fréquent quand il y a une ligne par gène), il y a de forte chances que cette matrice aura plus de lignes qu'il n'y a de pixels sur votre écran -- 1080 pixels verticaux sur un écran HD (à moins bien sûr que vous lisiez ceci dans un futur lointain d'hyper haute définition)...

Découverte :
Contrarié par les diagrammes de Venn ? Découvrez les diagrammes UpSet

Titre incluant un moyen mnémotechnique ;D

Avec ses cercles entrecroisés, on ne présente plus le célèbre diagramme de Venn. Cette représentation est utilisée dans le cas où l'on souhaite représenter le recoupement de données de nombre fini selon plusieurs variables qualitatives. De façon plus simple lorsqu'on a 2 variables qualitatives : combien d'éléments présents dans la catégorie A sont également présents ou non dans la catégorie B

Pourquoi des diagrammes "de Venn" ?

S'il est sûr que ces diagrammes représentant des proportions et leur partage date d'avant 1918, c'est à cette date que Clarence Irving Lewis (philosophe et logicien) utilise le terme de "diagramme de Venn"...

Découverte :
ViLoVar: un outil pour la visualisation de variations génétiques

Pour mon premier article, je vais vous présenter un outil que j'ai développé lorsque je travaillais sur le projet "Myocapture"; un projet national de séquençage d'exomes qui portait sur les myopathies (https://www.afm-telethon.fr/myopathie-congenitale-6675). Ce projet visait à trouver de nouvelles mutations responsables de ces maladies rares. Il a également permis d'identifier de nouveaux gènes impliqués dans des myopathies congénitales...

Découverte :
Tour d'horizon des outils de visualisation des réseaux biologiques

Après les différentes méthodes d'analyse et de représentation de réseaux métaboliques biologiques, je vais vous parler des différents outils de visualisation.  Car oui, la visualisation d'un réseau ou de ses sous-parties peut être le début de son analyse, car elle permet de se rendre compte de sa topologie, de sa complexité, sa connectivité...
Crée avec https://memegenerator.net
En biologie, on peut mettre sous la forme d'un réseau à peu près n'importe quel type de données à condition qu'elles présentent des relations entre elles...

Découverte :
iPath partout !

Depuis quelques mois j'utilise un outil nommé iPath2.0 qui peut être très utile pour certains.
Logo officiel d'iPath2.0
Présentation de l'outil
iPath2.0 est un outil en ligne, accessible à l'adresse http://pathways.embl.de/iPath2.cgi. Son principal intérêt est la visualisation et l'analyse de voies métabolique.

Didacticiel :
Gephi pour la visualisation et l'analyse de graphes

Logo Gephi | | Tous droits réservés
Gephi est un logiciel de visualisation et d'analyse de graphes. Il est distribué sous les licences CDDL 1.0 et GPLv3, et est disponible sur les principaux systèmes d'exploitation.
Gephi est prévu d'emblée pour tous types de graphes (pas seulement en bioinformatique) dans les principaux formats. Tulip et Cytoscape sont des outils similaires. Cependant, chez moi Cytoscape demande plein de dépendances difficiles à satisfaire, et Tulip fait un segfault au lancement...

Astuce :
Fabriquer un trackhub dans UCSC

J'ai décidé de partager avec vous la petite astuce du moment que j'ai découverte grâce à Jonathan et que j'ai incorporée dans mon travail actuel (merci encore à lui, il a lu toute l’infâme documentation de UCSC).
[edit : Il vient d'ailleurs de me signaler que la documentation pour les trackhubs vient d'être mise à jour et est devenue beaucoup plus digeste. Tant mieux pour les suivants.]
Le navigateur génomique (pour ne pas dire genome browser) de UCSC nous autorise donc à générer et visualiser des "trackhubs"...

Journal Club :
La nouvelle mode d'été : Journal Club au bord de la piscine

Comme vous l'avez certainement remarqué, le Journal Club du mois dernier n'a pas eu lieu. Je sais que vous en êtes profondément affligé(e)s, donc à charge de revanche, j'ai inclus des articles du mois passé. Il y a un peu plus de mots que d'habitude, mais quand on aime, on ne compte pas !
PLoS Comp Biol de juin 2012. Image : Theresa Niederberger, Gene Center, Ludwig-Maximilians-Universität München...

Découverte :
La modélisation moléculaire

http://farm1.staticflickr.com/24/47729306_d7ea6abfbb.jpg
La modélisation moléculaire est un ensemble de méthodes permettant d'expliquer comment fonctionne le vivant. En effet, le vivant est une succession d’interactions entre différentes molécules : protéines, ADN, ARN, membranes, etc. Ces molécules interagissent les unes par rapport aux autres en fonction de plusieurs paramètres : leurs formes, leurs propriétés chimiques et leur environnement...

Découverte :
Alignements multiples : quels logiciels choisir ?

Le but de cet article est de faire gagner du temps à vous, bioinformaticiens, qui comme moi auront un jour à travailler sur ce large sujet que sont les alignements multiples (ou MSA pour Multiple Sequence Alignements).
Dans le cadre de mon travail, j’ai eu à réaliser des alignements de séquences sur un nombre de séquences important et assez longues. Dans un premier temps, j'ai songé à appliquer mes connaissances acquises durant ma formation universitaire (Master de Bioinformatique de Bordeaux au passage, un peu de pub ne fera pas de mal à cette excellente formation française)...