Bioinformatique :
Enquête Bioinfo-fr 2018 : un portrait de la bioinfo

Après 1 mois et demi d'enquête et 1 mois et demi d'attente, voici donc l'article tant promis qui va décortiquer vos réponses!  Nous tenons par ailleurs à remercier tout les répondants qui ont donné de leur temps et qui auront partagé ce sondage dans leur entourage. Merci d'avoir contribué à cette enquête. 🙂
L'intégralité des données a été traitée via R dont les scripts sont disponibles sur le GitHub du blog...

Didacticiel :
LaTeX : les lettres (de motivation) !

Après avoir appris à compiler, à insérer des flottants, à mettre en forme les paragraphes et à insérer des mathématiques, il est temps de faire une petite pause hors de la classe article  et de se pencher sur les lettres (notamment parce que si mes prédictions sont justes, certain·e·s d'entre vous doivent écrire des lettres de motivation à l'heure qu'il est)...

Journal Club :
Quelques publications importantes récentes autour de la chromatine

Pour ceux qui travaillent sur la structure 3D de l'ADN et son comportement dans le noyau cellulaire, l'année 2017 a été une riche année. Comprendre les liens entre une séquence d'ADN et son repliement reste aujourd'hui un enjeu majeur pour cette communauté.
Caryotype Humain des chromosomes de l'homme en 3D, réalisé par Julien Mozziconaci et Annick Lesne. Pré-projet de l’oeuvre Human Genomics, produite par Le Fresnoy-Studio national des arts contemporains avec le soutien de la Fondation Daniel et Nina Carasso...

Didacticiel :
Inkscape pour biologistes

Fini les rectangles pour faire des protéines ou les images pixelisées chopées sur des sites douteux !
Dans 10 minutes vous serez un pro d'Inkscape qui est un logiciel gratuit pour "dessiner" avec une prise en main très rapide permettant de réaliser des figures vectorielles, non construites en pixels, pouvant être alors redimensionnées à l'infini en conservant toutes leurs qualités visuelles...

Découverte :
Apprivoiser l'ami ursidé de Python : Pandas

Durant mon stage de M2, j’ai eu l’occasion de chatouiller ce drôle d’animal qu’est pandas. En effet, j’ai travaillé sur des données de protéomique contenues dans des fichiers tabulés. Il s'agissait de comparer la présence des protéines ou leur expression dans différents échantillons. Les abondances relatives (la variable étudiée) étaient indiquées pour les différentes protéines identifiées (plusieurs milliers et correspondant aux lignes du fichier) dans les différents échantillons analysés (correspondant aux colonnes)...

Opinion :
Les commandements du stagiaire en bioinformatique

La période des stages n'est pas loin et toi, jeune étudiant(e) bioinformaticien(ne) - futur(e) stagiaire, te demandes comment choisir parmi toutes ces annonces. Pas de panique, c'est tout à fait normal de se poser toute une ribambelle de questions, nous y sommes tous passés. La bonne nouvelle c'est que c'est ton jour de chance : les réponses se trouvent (normalement) dans ce billet.
À la recherche du stage : Motivation, mon amie
Job search | Kate Hiscock
La première des choses à cocher dans ta checklist c'est la motivation...

Découverte :
Qu'est-ce qu'un site d'initiation de la transcription ?

Comment je me suis posé la question.
Chez les eucaryotes, l'ADN est organisé en domaines plus ou moins compactés, avec des taux de transcription plus ou moins élevés, et qui sont marqués différentiellement par un certain nombre de marques épigénétiques (méthylation de l'ADN, modifications post-traductionnelles des histones, variants d'histones, etc.). Il est fréquent d'essayer de corréler le niveau d'expression des gènes avec la présence ou l'absence d'une marque épigénétique à proximité des sites d’initiations de la transcription (raccourcis en TSS, pour transcription start sites)...

Didacticiel :
LaTeX : automatisez le traitement des CSV

Vous avez peut-être vu l'excellent article de Chopopope sur l'utilisation des flottants en LaTeX, et en particulier la partie sur la création de tableaux. Non ? Pour les retardataires, c'est par ici…
Vous vous êtes surement rendu compte que créer des tableaux peut être long et fastidieux. De plus, en bons bioinformaticiens, vos données tabulées sont écrites dans des fichiers Exc… CSV. Et vous trouvez un peu bête (pour ne pas dire plus) de devoir recopier votre fichier CSV dans LaTeX tout en formatant le tableau...

Astuce :
Customiser matplotlib (faire son matplotlibrc)

Suite à une mésaventure liée à matplotlib sur le chan IRC #bioinfo-fr (mésaventure suite aux fameuses erreurs de display ; si vous voulez tout savoir : si on configure mal son matplotlib on peut générer des erreurs qui font qu'on obtient des images vides… voir la partie sur le backend plus tard :o), j'ai parlé de la joie qu'est d'avoir un matplotlibrc et à quel point ça simplifie la vie...

Découverte :
Les bases de données de séquençage : GEO, SRA, ENA, ArrayExpress

De nos jours, lors de la publication de résultats, il est nécessaire de rendre public les éventuelles données de séquençage générées. Si un faible nombre d’irréductibles continuent à ne fournir les données que sur demande, les bonnes pratiques poussent à les déposer dans des bases de données librement accessibles. Quatre grandes bases de données de séquençage existent : les états-uniennes  GEO et SRA du NCBI, et les européennes ArrayExpress et ENA de l'EMBL-EBI...