On s'en va se reposer au soleil

On se détend, on souffle et on apprécie le paysage offert par nos vacances | CC-BY-NC Gwenaëlle L.

Juillet est déjà bientôt terminé, certains de nos auteurs sont déjà en randonnée en montagne ou les pieds dans le sable, alors il est temps de faire notre pause estivale !

On se revoit à la rentrée avec tout plein de super articles qu'on a déjà en stock. Au programme : un échange d'avis sur R et Python garantis sans trolls (ou presque), des metacodes barre, des réseaux et... On ne va pas tout vous divulgâcher quand même ! Et si vous sentez que cette année c'est la vôtre, contactez nous pour devenir un des célèbres auteurs de bioinfo-fr, nous nous ferons un plaisir de vous accueillir et de vous accompagner dans l'écriture d'un ou plusieurs articles !

Pour ceux qui seraient en manque du blog, on vous suggère de relire certains de nos articles de l'année ou bien nos best-sellers :

En attendant la rentrée, on vous souhaite un bel été 😉

Édito

Opinion :
Pourquoi écrire sur un blog communautaire ?

7 ans... 7 ans entre l'écriture de mon premier article ici et aujourd'hui. De cette longue route m'est venue l'envie de faire un billet personnel sur pourquoi à mon sens, un blog communautaire a plus d'importance qu'un blog personnel.

Et si tu venais participer toi aussi ?

Les réflexions qui suivent sont totalement personnelles et n'engagent que moi. *

Mon histoire sur ce blog

Sans aucune prétention de profiter de ce billet pour m'auto-interviewer, il me semble important de raconter un peu mon chemin sur cette plateforme avant de donner quelques arguments plus concrets...

Découverte :
Pourquoi certains fichiers FASTQ finissent par 001 ?

Les fichiers .fastq finissant en _001.fastq.gz

Sur le chan IRC du blog, un de nos membres se demandait pourquoi les noms de fichiers FASTQ devait finir par _001.fastq sur la plateforme de cloud computing d'Illumina BaseSpace. Mais avant de répondre à cette question pressante, repartons du début.

Les fichiers FASTQ

En cette période de domination du séquençage haut débit de l'ADN, le format de fichier ...

Didacticiel :
Installer JupyterHub pour des Notebooks hébergés sur votre serveur

Vous connaissez sans doute déjà les notebooks Jupyter [1], ces documents web où l'on peut
rédiger du contenu en Markdown, pouvant contenir des formules mathématiques en LaTeX, mêlées à des cellules de code
Python, (ou R, Julia etc.) que l'on peut exécuter au cas par cas de façon interactive. Ils sont pas mal utilisés en
data science pour explorer un jeu de données où créer un modèle de machine learning progressivement, par exemple...

Astuce :
Organiser une conférence en ligne : trucs et astuces

Télétravail et visioconférence, notre nouveau quotidien (source: pixabay)

Organiser une conférence est complexe. Mais organiser une conférence en ligne... c'est TRÈS complexe. Si l'ordinateur qui diffuse la conférence plante... comment prévenir l'audience ? La moindre erreur technique fait d'avantage peur car il devient plus difficile de rebondir et d’expliquer l'issue à la 'salle'...

Actualité :
Meet-4EU+, le bilan!

Bien le bonjour amis lecteurs. Pour le billet du jour je vous propose une visite dans les coulisses d'un cours/projet déroulé cette année à l'université de la Sorbonne : Meet-4EU+. J'apporterai ainsi mon regard sur l'organisation de cette année, agrémentée de quelques petites anecdotes subjectives.

L'idée de ce cours est de proposer aux étudiants de master 2 de bio-informatique un projet qu'ils devront réaliser et présenter à la fin du semestre à une conférence devant un jury d'experts...

Actualité :
Big Day 2020 : Invitation à un événement de partage autour de la bioinformatique

Que faites-vous le vendredi 27 novembre prochain ? Et pourquoi ne pas réserver ce jour pour découvrir le Big Day 2020 ? C’est un événement gratuit, organisé par des étudiant⋅e⋅s pour des étudiant⋅e⋅s, mais aussi pour n’importe quelle personne intéressée par le domaine de la bioinformatique.

Affiche de l'édition 2020 du BIG Day 2020

Qu'est-ce que le Big Day ?

Le Big Day se veut être une journée de découverte et de partage autour de la bioinformatique...

Découverte :
La transcriptomique spatiale

Non, on ne va pas partir faire du RNA-seq dans la station spatiale internationale, rassurez-vous. Je vais vous parler de cette (relativement) nouvelle technique qui permet en une seule expérience de mesurer l'expression des gènes et de localiser cette expression dans un organe plus ou moins complexe.
Pour faire une analyse à large échelle du niveau d'expression des gènes dans un tissu, rien ne vaut la transcriptomique...

Suivez l'guide :
Qu'est ce qu'un TAD? (Topological associated domain)

Dans l'article précédent, j'ai parlé des différentes échelles d'organisation de la chromatine mais me suis attardé sur les échelons les plus grands. Cette observation globale de la carte a alors permis de définir la notion de compartiment génomique. Mais comment l'ADN s'organise localement? Qu'observe-t-on sur une carte de contact chromosomique en zoomant finement sur une région plutôt que regarder un chromosome entier? Aujourd'hui je vous propose de continuer d'en apprendre plus sur le sujet en essayant de comprendre ce qu'est un TAD (pour topological associated domain)...

Didacticiel :
Pourquoi et comment déposer un package R sur Bioconductor ?

Ça y est, votre code R un poil brut commence à avoir de la substance et vous envisagez d'en faire un outil à part entière. Comme tout bioinformaticien qui se respecte, vous envisagez donc de packager (ou paqueter en français) proprement cet ensemble de scripts R.

Non on ne largue pas une nuée de scripts non commentés, non documentés, avec juste un mail disant "Non mais tu changes tel et tel paramètres et ça fonctionne"...

Astuce :
Créer des Heatmaps à partir de grosses matrices en R

En génomique, et sans doute dans tout un tas d'autres domaines omiques ou big data, nous essayons souvent de tracer des grosses matrices sous forme d'heatmap. Par grosse matrice, j'entends une matrice dont le nombre de lignes et/ou de colonnes est plus grand que le nombre de pixels sur l'écran que vous utilisez. Par exemples, si vous avez une matrice de 50 colonnes et de 20 000 lignes (cas assez fréquent quand il y a une ligne par gène), il y a de forte chances que cette matrice aura plus de lignes qu'il n'y a de pixels sur votre écran -- 1080 pixels verticaux sur un écran HD (à moins bien sûr que vous lisiez ceci dans un futur lointain d'hyper haute définition)...