Auteur/autrice : Julien Delafontaine

Ses publications :

  • Vers une meilleure encryption des données génétiques

    Vers une meilleure encryption des données génétiques

    La démo­cra­ti­sa­tion du séquen­çage du génome humain, ouvrant les portes de la méde­cine per­son­na­li­sée, pro­voque aus­si beau­coup d'inquiétudes au sujet de la pro­tec­tion des don­nées. La séquence unique de l'ADN d'un indi­vi­du, en effet, peut indi­quer entre autres les pré­dis­po­si­tions à des mala­dies, la tolé­rance à diverses sub­stances, les traits poten­tiels de la des­cen­dance, le…

  • L'analyse en composantes principales (avec R)

    L'analyse en composantes principales (avec R)

    L'ACP, ou Ana­lyse en Com­po­santes Prin­ci­pales, est une méthode d'exploration de don­nées qui consiste à réduire la dimen­sion­na­li­té du pro­blème pour en extraire l'essentiel. Par une pro­jec­tion dans un espace plus petit, on réduit le nombre de variables, et si on réduit suf­fi­sam­ment on peut en faire un outil de diag­nos­tic gra­phique. Comme c'est une…

  • Cython : votre programme Python mais 100x plus vite

    Cython : votre programme Python mais 100x plus vite

    Python est un lan­gage extrê­me­ment pra­tique car il est facile à lire et à écrire, com­pa­ré à un lan­gage de "bas niveau" et com­pi­lé comme le C. D'un autre côté, à l'exécution il est beau­coup plus lent. C'est un com­pro­mis entre les deux qu'offre Cython, per­met­tant d'accélérer votre pro­gramme d'un fac­teur 2 à plus de…

  • BLAST en pratique

    BLAST en pratique

    Cet article a pour but de vous mon­trer une appli­ca­tion pra­tique de BLAST, le fameux pro­gramme d'ali­gne­ment de séquences déte­nant un record de cita­tions, avec cer­tains pro­blèmes qu'on peut ren­con­trer et ce qu'on peut tirer de son résul­tat. BLAST a au moins deux usages typiques en géno­mique : Trou­ver les occur­rences simi­laires à une séquence de…

  • Les mélanges gaussiens

    Les mélanges gaussiens

    La plu­part des mesures que l'on obtient des expé­riences en bio­lo­gie suivent approxi­ma­ti­ve­ment une dis­tri­bu­tion dite "nor­male", ou "gaus­sienne", dont la den­si­té a la forme d'une cloche, symé­trique avec un unique som­met au milieu. C'est aus­si l'hypothèse d'un grand nombre d'outils d'analyse sta­tis­tique. Mais que faire quand on observe deux som­mets ou plus ? Le plus…

  • Julia : le successeur de R ?

    Julia : le successeur de R ?

    Actuel­le­ment le lan­gage R est incon­tour­nable pour qui veut mani­pu­ler des don­nées en bio­in­for­ma­tique, en par­ti­cu­lier pour l'analyse sta­tis­tique. Mais un suc­ces­seur est en passe de s'imposer : Julia, com­bi­nant puis­sance du lan­gage avec les fonc­tion­na­li­tés de R, et com­blant les nom­breux défauts de ce der­nier — mais plus encore ! Voi­ci une pré­sen­ta­tion de ce tout…

  • L'analyse de données RNA-seq : mode d'emploi

    L'analyse de données RNA-seq : mode d'emploi

    Un jour, un bio­lo­giste se pointe chez vous avec d'une part un disque dur externe dans la main, d'autre part l'air sou­cieux. Il veut que vous ana­ly­siez ses don­nées RNA-seq. Le disque, c'est parce qu'il a envi­ron 50Gb de don­nées à vous trans­mettre ; l'air sou­cieux, c'est parce qu'elles ont coû­té dans les 15'000 euros, et…