Catégorie : Découverte
-
Former et se former en bioinformatique avec GOBLET !
Dans cet article, je vous présenterai un nouveau site qui peut être intéressant aussi bien pour les étudiants que pour les enseignants, voire également pour les bioinformaticiens déjà en fonction. Ici je ne vous noierai pas sous les lignes de code, mais je vous décrirai ce que le portail GOBLET vous propose en terme d'exercice.…
-
L'analyse en composantes principales (avec R)
L'ACP, ou Analyse en Composantes Principales, est une méthode d'exploration de données qui consiste à réduire la dimensionnalité du problème pour en extraire l'essentiel. Par une projection dans un espace plus petit, on réduit le nombre de variables, et si on réduit suffisamment on peut en faire un outil de diagnostic graphique. Comme c'est une…
-
Open Refine
Un grand coup de balai Le nettoyage de données est un défi en bioinformatique. Entre les personnes qui veulent réinventer les standards et les personnes qui ne savent pas les suivre, nous nous trouvons souvent en train de nettoyer, de formater et de changer la structure de nos données pour qu'elles soient conformes à une…
-
Python fait la numba
Suite à cet article, j'ai eu envie de comparer les temps d'exécution de Cython et Numba.Il est toujours intéressant de faire des tests de performances (benchmarks) de temps à autre, pour voir si on ne peut pas améliorer certains de nos algorithmes 🙂 Cython est un très bon moyen pour optimiser vos programmes, mais il…
-
Les 10 ans du World Community Grid
Le 16 novembre 2014, le World Community Grid (WCG) fête ses 10 ans d’existence. Créé par IBM en 2004, ce projet de grille de calcul distribué par ordinateur se donne pour mission de soutenir des projets de recherche à fins humanitaires. Selon Wikipedia, une grille de calcul est une infrastructure virtuelle "qui exploite la puissance…
-
Comparaison de structures : le TM-Score
Pour comparer des structures 3D de protéines, nous avons vu le RMSD dans un précédent article. Je vous propose cette semaine de parler du TM-Score décrit par Zhang et Skolnick en 2004. Les bases Le TM-Score a été développé afin de calculer la qualité des structures de protéines prédites lors de la compétition CASP5. Le but…
-
Hi-C : Quelques bases
Aujourd'hui on va découvrir ensemble une des petites dernières dans la famille des techniques hauts débits : le High Chromosome Contact map (Hi C)[1] . Revenons sur quelques bases : un gène ne pourra être exprimé que si l'ADN qui le code est déplié. Par conséquent les régions dans lesquelles les gènes ne sont pas exprimés sont…