Étiquette : R

  • De la procrastination dans l'R

    De la procrastination dans l'R

    Connaissances requises Connais­sances basiques en R. Si vous ne faites pas la dif­fé­rence entre un test exact de Fisher et le test du Chi‑2, cela ne devrait pas poser de pro­blème. Euh, bah c'est tout ! Introduction Si l'on s'en réfère à la défi­ni­tion : Un infor­ma­ti­cien, et a for­tio­ri un bio­in­for­ma­ti­cien, fera tout pour mettre en œuvre des…

  • L'annotation de régions génomiques et les analyses d’enrichissement

    L'annotation de régions génomiques et les analyses d’enrichissement

    Les anno­ta­tions sont essen­tielles lors d'analyses fonc­tion­nelles à large échelle sur le génome.  Lorsque l’on pra­tique des ana­lyses en géno­mique, basées sur des tech­niques comme le RNA-seq ou le ChIP-seq, on se retrouve avec res­pec­ti­ve­ment une liste de trans­crits ou de pics (régions géno­miques). Dans le cas des ana­lyses ChIP-seq, on sou­haite carac­té­ri­ser les gènes cibles du fac­teur…

  • L'analyse en composantes principales (avec R)

    L'analyse en composantes principales (avec R)

    L'ACP, ou Ana­lyse en Com­po­santes Prin­ci­pales, est une méthode d'exploration de don­nées qui consiste à réduire la dimen­sion­na­li­té du pro­blème pour en extraire l'essentiel. Par une pro­jec­tion dans un espace plus petit, on réduit le nombre de variables, et si on réduit suf­fi­sam­ment on peut en faire un outil de diag­nos­tic gra­phique. Comme c'est une…

  • Guide de démarrage pour ggplot2, un package graphique pour R

    Guide de démarrage pour ggplot2, un package graphique pour R

    Le trai­te­ment et l’analyse de don­nées sont une part impor­tante des tâches deman­dées à un bio­in­for­ma­ti­cien. L’utilisation de R faci­lite gran­de­ment la mani­pu­la­tion des don­nées et per­met éga­le­ment leur repré­sen­ta­tion de mul­tiples façons. Mal­gré le poten­tiel de R, ce der­nier est sou­vent sous-exploi­té à cause d’une syn­taxe par­fois trop com­plexe. Je vais vous pré­sen­ter aujourd’hui…

  • Les mélanges gaussiens

    Les mélanges gaussiens

    La plu­part des mesures que l'on obtient des expé­riences en bio­lo­gie suivent approxi­ma­ti­ve­ment une dis­tri­bu­tion dite "nor­male", ou "gaus­sienne", dont la den­si­té a la forme d'une cloche, symé­trique avec un unique som­met au milieu. C'est aus­si l'hypothèse d'un grand nombre d'outils d'analyse sta­tis­tique. Mais que faire quand on observe deux som­mets ou plus ? Le plus…

  • Julia : le successeur de R ?

    Julia : le successeur de R ?

    Actuel­le­ment le lan­gage R est incon­tour­nable pour qui veut mani­pu­ler des don­nées en bio­in­for­ma­tique, en par­ti­cu­lier pour l'analyse sta­tis­tique. Mais un suc­ces­seur est en passe de s'imposer : Julia, com­bi­nant puis­sance du lan­gage avec les fonc­tion­na­li­tés de R, et com­blant les nom­breux défauts de ce der­nier — mais plus encore ! Voi­ci une pré­sen­ta­tion de ce tout…

  • Suivez le guide : en quête de HMM

    Suivez le guide : en quête de HMM

    Bases Théoriques : Une chaîne de Mar­kov , ça vous dit quelque chose ? Une classe de modèles de Mar­kov, appe­lée Modèle de Mar­kov Caché (Hid­den Mar­kov Model, HMM), est un modèle mathé­ma­tique per­met­tant de seg­men­ter un signal obser­vé en régions (états cachés) défi­nis par le modèle. Lequel est com­po­sé de quatre élé­ments : N états, une matrice d’émissions, des condi­tions…

  • Cours de R pour débutant pressé, deuxième épisode

    Cours de R pour débutant pressé, deuxième épisode

    Voi­ci donc la suite de mon pre­mier cours de R pour débu­tants pres­sés où nous avions vu les bases. Je vous invite à le lire si vous ne l’avez pas déjà fait. Aujourd’hui le but est de s’approcher de la bio­lo­gie et de trai­ter d’un cas concret. Nous avons des don­nées de dif­fé­rents élé­ments fonc­tion­nels du…