Étiquette : R

  • Fréquences des dinucléotides dans le génome d'organismes modèles

    Fréquences des dinucléotides dans le génome d'organismes modèles

    L'analyse de séquences est au cœur de nom­breux domaines de la bio-infor­ma­tique. Le billet du jour s'intéressera aux séquences ADN, en se pro­po­sant de comp­ter la fré­quence en dinu­cléo­tides dans quelques génomes d'organismes modèles (avec une petite arrière-pen­sée der­rière la tête). Qu'est-ce qu'un dinucléotide ? L'ADN double brins est clas­si­que­ment struc­tu­ré sous forme de double hélice,…

  • Manipulation d'intervalles génomiques dans R

    Manipulation d'intervalles génomiques dans R

    Introduction Nous avons abor­dé, dans le pré­cé­dent article de cette série, les bases de la mani­pu­la­tion d'intervalles dans R. Ce deuxième article a pour objec­tif de mon­trer com­ment mani­pu­ler des inter­valles géno­miques. Au niveau le plus basique, un inter­valle est défi­ni par deux nombres entiers posi­tifs déli­mi­tant son début et sa fin. Nous allons pou­voir…

  • Introduction à la manipulation d'intervalles dans R

    Introduction à la manipulation d'intervalles dans R

    Introduction "Quelle est la pro­fon­deur de ce séquen­çage ?" "Quelle pro­por­tion de SNPs se situent dans des exons ?" "Y a‑t-il des pics dans ces don­nées de ChIP-seq ?" "Quelle pro­por­tion de pro­mo­teurs che­vauchent des îlots CpG ?" Voi­là le genre de ques­tions ren­con­trées fré­quem­ment en bio­in­for­ma­tique. Nous pou­vons y répondre à l'aide de la…

  • Choisir entre R et Python en bioinformatique ? Regards croisés entre collègues enseignants-chercheurs

    Choisir entre R et Python en bioinformatique ? Regards croisés entre collègues enseignants-chercheurs

    Gaëlle Lelan­dais et Pierre Pou­lain Qui sommes-nous ? Tous les deux pas­sion­nés par l’enseignement, les pro­blé­ma­tiques de big data et d’analyse de don­nées en bio­lo­gie, nous nous côtoyons pro­fes­sion­nel­le­ment depuis 15 ans, avec écoute et bien­veillance. Si l’étiquette de « bio­in­for­ma­ti­cien » nous est sou­vent attri­buée, nous sommes pour­tant très dif­fé­rents. Je (Gaëlle) tra­vaille sur des pro­blé­ma­tiques de…

  • Pourquoi et comment déposer un package R sur Bioconductor ?

    Pourquoi et comment déposer un package R sur Bioconductor ?

    Ça y est, votre code R un poil brut com­mence à avoir de la sub­stance et vous envi­sa­gez d'en faire un outil à part entière. Comme tout bio­in­for­ma­ti­cien qui se res­pecte, vous envi­sa­gez donc de packa­ger (ou paque­ter en fran­çais) pro­pre­ment cet ensemble de scripts R. Non on ne largue pas une nuée de scripts…

  • Créer des Heatmaps à partir de grosses matrices en R

    Créer des Heatmaps à partir de grosses matrices en R

    En géno­mique, et sans doute dans tout un tas d'autres domaines omiques ou big data, nous essayons sou­vent de tra­cer des grosses matrices sous forme d'heat­map. Par grosse matrice, j'entends une matrice dont le nombre de lignes et/​ou de colonnes est plus grand que le nombre de pixels sur l'écran que vous uti­li­sez. Par exemples,…

  • Rendre ses projets R plus accessibles grâce à Shiny

    Bon­jour à tous ! Vous avez un script que vous sou­hai­tez par­ta­ger avec une équipe expé­ri­men­tale ? Vous ne vou­lez pas que les uti­li­sa­teurs modi­fient le code pour para­mé­trer votre pro­gramme ? Vous codez avec R ? Alors cet article est fait pour vous ! Nous allons voir com­ment créer une appli­ca­tion web avec R et per­mettre à votre uti­li­sa­teur…

  • Qu'est-ce qu'un site d'initiation de la transcription ?

    Qu'est-ce qu'un site d'initiation de la transcription ?

    Comment je me suis posé la question. Chez les euca­ryotes, l'ADN est orga­ni­sé en domaines plus ou moins com­pac­tés, avec des taux de trans­crip­tion plus ou moins éle­vés, et qui sont mar­qués dif­fé­ren­tiel­le­ment par un cer­tain nombre de marques épi­gé­né­tiques (méthy­la­tion de l'ADN, modi­fi­ca­tions post-tra­duc­tion­nelles des his­tones, variants d'histones, etc.). Il est fré­quent d'essayer de…

  • Maîtrisez le cache de Rmarkdown !

    Maîtrisez le cache de Rmarkdown !

    Pour des rai­sons de repro­duc­tion de la science, il est impor­tant de conser­ver une trace de tout ce que l'on fait sur son ordi­na­teur. Pour cela, faire des rap­ports est la meilleure manière que je connaisse qui per­mette d'inclure le code et les résul­tats d'une ana­lyse. Pour faire ça bien avec R, on a déjà…