6 ans... et des questions !

Questionnaire | Nick Youngson (CC-BY-SA 3.0)

Vous ne le saviez peut-être pas mais nous venons de souffler fièrement notre sixième bougie !

6 ans ! Que de savoir autour de la bioinformatique partagé ! Merci à toutes et à tous pour vos soutiens sans faille.

On voulait marquer le coup cette année : nous avons donc mis en place un questionnaire orienté autour du quotidien d'un(e) bioinformaticien(ne). L'idée est de proposer une photo du paysage bioinfo francophone en 2018. Si comme on l'espère cela vous plait, on essayera de reproduire l'expérience à l'international !

 

Trêve de blabla, ça se passe ici : https://framaforms.org/questionnaire-bioinfo-fr-2018-1518110073

 

Le questionnaire est anonyme et nous n'avons aucun accès à vos IPs ou autres informations qui permettraient de vous identifier. Merci d'avance de jouer le jeu et de faire tourner le formulaire à tous vos contacts dans la bioinfo.

Date de fermeture du questionnaire : 30 avril 2018. L'analyse des résultats sera proposée sous forme d'article ici-même.

Édito

Didacticiel :
LaTeX : les lettres (de motivation) !

Après avoir appris à compiler, à insérer des flottants, à mettre en forme les paragraphes et à insérer des mathématiques, il est temps de faire une petite pause hors de la classe article  et de se pencher sur les lettres (notamment parce que si mes prédictions sont justes, certain·e·s d'entre vous doivent écrire des lettres de motivation à l'heure qu'il est)...

Journal Club :
Quelques publications importantes récentes autour de la chromatine

Pour ceux qui travaillent sur la structure 3D de l'ADN et son comportement dans le noyau cellulaire, l'année 2017 a été une riche année. Comprendre les liens entre une séquence d'ADN et son repliement reste aujourd'hui un enjeu majeur pour cette communauté.

Pour tous ceux qui ne savent pas ce qui se passe dans notre petit monde, nous allons parler aujourd'hui de quelques publications sorties au cours de 2017 et début 2018 sur le sujet...

Didacticiel :
Inkscape pour biologistes

Fini les rectangles pour faire des protéines ou les images pixelisées chopées sur des sites douteux !
Dans 10 minutes vous serez un pro d'Inkscape qui est un logiciel gratuit pour "dessiner" avec une prise en main très rapide permettant de réaliser des figures vectorielles, non construites en pixels, pouvant être alors redimensionnées à l'infini en conservant toutes leurs qualités visuelles...

Découverte :
Apprivoiser l'ami ursidé de Python : Pandas

Durant mon stage de M2, j’ai eu l’occasion de chatouiller ce drôle d’animal qu’est pandas. En effet, j’ai travaillé sur des données de protéomique contenues dans des fichiers tabulés. Il s'agissait de comparer la présence des protéines ou leur expression dans différents échantillons. Les abondances relatives (la variable étudiée) étaient indiquées pour les différentes protéines identifiées (plusieurs milliers et correspondant aux lignes du fichier) dans les différents échantillons analysés (correspondant aux colonnes)...

Opinion :
Les commandements du stagiaire en bioinformatique

La période des stages n'est pas loin et toi, jeune étudiant(e) bioinformaticien(ne) - futur(e) stagiaire, te demandes comment choisir parmi toutes ces annonces. Pas de panique, c'est tout à fait normal de se poser toute une ribambelle de questions, nous y sommes tous passés. La bonne nouvelle c'est que c'est ton jour de chance : les réponses se trouvent (normalement) dans ce billet.
À la recherche du stage : Motivation, mon amie

La première des choses à cocher dans ta checklist c'est la motivation...

Découverte :
Qu'est-ce qu'un site d'initiation de la transcription ?

Comment je me suis posé la question.
Chez les eucaryotes, l'ADN est organisé en domaines plus ou moins compactés, avec des taux de transcription plus ou moins élevés, et qui sont marqués différentiellement par un certain nombre de marques épigénétiques (méthylation de l'ADN, modifications post-traductionnelles des histones, variants d'histones, etc.). Il est fréquent d'essayer de corréler le niveau d'expression des gènes avec la présence ou l'absence d'une marque épigénétique à proximité des sites d’initiations de la transcription (raccourcis en TSS, pour transcription start sites)...

Didacticiel :
LaTeX : automatisez le traitement des CSV

Vous avez peut-être vu l'excellent article de Chopopope sur l'utilisation des flottants en LaTeX, et en particulier la partie sur la création de tableaux. Non ? Pour les retardataires, c'est par ici…
Vous vous êtes surement rendu compte que créer des tableaux peut être long et fastidieux. De plus, en bons bioinformaticiens, vos données tabulées sont écrites dans des fichiers Exc… CSV. Et vous trouvez un peu bête (pour ne pas dire plus) de devoir recopier votre fichier CSV dans LaTeX tout en formatant le tableau...

Astuce :
Customiser matplotlib (faire son matplotlibrc)

Suite à une mésaventure liée à matplotlib sur le chan IRC #bioinfo-fr (mésaventure suite aux fameuses erreurs de display ; si vous voulez tout savoir : si on configure mal son matplotlib on peut générer des erreurs qui font qu'on obtient des images vides… voir la partie sur le backend plus tard :o), j'ai parlé de la joie qu'est d'avoir un matplotlibrc et à quel point ça simplifie la vie...

Découverte :
Les bases de données de séquençage : GEO, SRA, ENA, ArrayExpress

De nos jours, lors de la publication de résultats, il est nécessaire de rendre public les éventuelles données de séquençage générées. Si un faible nombre d’irréductibles continuent à ne fournir les données que sur demande, les bonnes pratiques poussent à les déposer dans des bases de données librement accessibles. Quatre grandes bases de données de séquençage existent : les états-uniennes  GEO et SRA du NCBI, et les européennes ArrayExpress et ENA de l'EMBL-EBI...

Astuce :
Maîtrisez le cache de Rmarkdown !

Pour des raisons de reproduction de la science, il est important de conserver une trace de tout ce que l'on fait sur son ordinateur. Pour cela, faire des rapports est la meilleure manière que je connaisse qui permette d'inclure le code et les résultats d'une analyse. Pour faire ça bien avec R, on a déjà vu dans un article précédant que les rapports Rmarkdown étaient une très bonne solution...