Putain, 10 ans !

The birthday cat | Harry Whittier Frees

Voilà une décennie que ce blog existe, et même deux ans de plus pour le canal IRC qui était sa genèse !

Ce projet a été rendu possible grâce à une communauté d'une trentaine d'auteurs initialement motivés pour faire découvrir la bioinfo au monde francophone et répondre aux questions les plus fréquentes qu'ils pouvaient entendre. La pérennité a ensuite été assurée par le renfort de nouveaux venus, apportant avec eux de nouvelles idées d'articles, de formats, et son lot de discussions. Avec cet édito, nous souhaitons remercier chacun d'entre vous, auteurs et lecteurs, nous l'équipe d'admin qui a également variée au cours du temps.

À l'occasion de cet anniversaire exceptionnel, nous allons effectuer une rétrospective sur ces années de connaissances couchées sur pixels. Elle sera également accompagnée des retours de nos anciens auteurs qu'on aura pu recontacter, ainsi que de nos auteurs actuels. N'hésitez pas à nous contacter à admin(AT)bioinfo-fr.net si vous n'avez pas reçu notre mail !

Longue vie au blog !

Édito

Opinion :
Qu'est-ce qu'un bon fichier Lisez-moi.txt

Vous venez de finir votre outil sur lequel vous travaillez depuis 1 semaine/1 mois/1 an/10 ans (rayez la mention inutile) qui va révolutionner votre domaine.

Votre code est versionné, formaté, commenté, documenté, testé, les résultats sont évalués selon le gold standard de la discipline sur des jeux de données représentatifs de la réalité, votre publication est prête, vous allez l'envoyer sur le dépôt de preprint et au journal, le thread Twitter d'annonce est rédigé...

Suivez l'guide :
Introduction à la manipulation d'intervalles dans R

Introduction

"Quelle est la profondeur de ce séquençage ?"

"Quelle proportion de SNPs se situent dans des exons ?"

"Y a-t-il des pics dans ces données de ChIP-seq ?"

"Quelle proportion de promoteurs chevauchent des îlots CpG ?"

Voilà le genre de questions rencontrées fréquemment en bioinformatique. Nous pouvons y répondre à l'aide de la manipulation d'intervalles...

Découverte :
Métabarcodes de l'ADN environnemental

L'une des technologies en génomique les plus prometteuses pour l'évaluation de la biodiversité est le métabarcode (de l'anglais metabarcoding) de l'ADN environnemental (ADNe). J'ai travaillé longuement sur ces méthodes et développé plusieurs workflows pour traiter et analyser les données de métabarcodes. J'ai notamment été en charge du traitement des données génomiques récoltées par l’expédition scientifique d'exploration marine de Monaco entre 2018 et 2020...

Opinion :
Choisir entre R et Python en bioinformatique ? Regards croisés entre collègues enseignants-chercheurs

Gaëlle Lelandais et Pierre Poulain

Qui sommes-nous ?

Tous les deux passionnés par l’enseignement, les problématiques de big data et d’analyse de données en biologie, nous nous côtoyons professionnellement depuis 15 ans, avec écoute et bienveillance. Si l’étiquette de « bioinformaticien » nous est souvent attribuée, nous sommes pourtant très différents.

Je (Gaëlle) travaille sur des problématiques de génomique fonctionnelle des champignons...

Opinion :
Pourquoi écrire sur un blog communautaire ?

7 ans... 7 ans entre l'écriture de mon premier article ici et aujourd'hui. De cette longue route m'est venue l'envie de faire un billet personnel sur pourquoi à mon sens, un blog communautaire a plus d'importance qu'un blog personnel.

Et si tu venais participer toi aussi ?

Les réflexions qui suivent sont totalement personnelles et n'engagent que moi. *

Mon histoire sur ce blog

Sans aucune prétention de profiter de ce billet pour m'auto-interviewer, il me semble important de raconter un peu mon chemin sur cette plateforme avant de donner quelques arguments plus concrets...

Découverte :
Pourquoi certains fichiers FASTQ finissent par 001 ?

Les fichiers .fastq finissant en _001.fastq.gz

Sur le chan IRC du blog, un de nos membres se demandait pourquoi les noms de fichiers FASTQ devait finir par _001.fastq sur la plateforme de cloud computing d'Illumina BaseSpace. Mais avant de répondre à cette question pressante, repartons du début.

Les fichiers FASTQ

En cette période de domination du séquençage haut débit de l'ADN, le format de fichier ...

Actualité :
Migration de notre IRC de Freenode vers Libera

Vous le savez sûrement, Bioinfo-fr ce n'est pas qu'un blog, c'est aussi un salon de discussion (ou chat) en ligne pour discuter en direct. Historiquement, notre salon IRC (Internet Relay Chat) #bioinfo-fr était hébergé sur un réseau nommé Freenode, dédié aux projets et logiciels libres en tous genres. Ce réseau fondé en 1994, comptait en moyenne jusqu'à 50 000 utilisateurs connectés.

Migrons! (CC BY-SA par Nasser Akabab)

En ce mois de juin 2021, suite à un rachat du réseau par une compagnie privée, une majeur partie des administrateurs ont démissionné par crainte du non respect de la philosophie open source du réseau originel...

Didacticiel :
Installer JupyterHub pour des Notebooks hébergés sur votre serveur

Vous connaissez sans doute déjà les notebooks Jupyter [1], ces documents web où l'on peut
rédiger du contenu en Markdown, pouvant contenir des formules mathématiques en LaTeX, mêlées à des cellules de code
Python, (ou R, Julia etc.) que l'on peut exécuter au cas par cas de façon interactive. Ils sont pas mal utilisés en
data science pour explorer un jeu de données où créer un modèle de machine learning progressivement, par exemple...

Astuce :
Organiser une conférence en ligne : trucs et astuces

Télétravail et visioconférence, notre nouveau quotidien (source: pixabay)

Organiser une conférence est complexe. Mais organiser une conférence en ligne... c'est TRÈS complexe. Si l'ordinateur qui diffuse la conférence plante... comment prévenir l'audience ? La moindre erreur technique fait d'avantage peur car il devient plus difficile de rebondir et d’expliquer l'issue à la 'salle'...