- Le blog participatif de bioinformatique francophone depuis 2012 -

Catégorie : Suivez l'guide

  • IA et bioinformatique : exploitons les réseaux convolutionnels (CNN)

    IA et bioinformatique : exploitons les réseaux convolutionnels (CNN)

    Inter­es­sons-nous aujourd'hui aux séquences d’ADN. Nous uti­li­se­rons le data­set télé­char­geable ici : https://​www​.kaggle​.com/​d​a​t​a​s​e​t​s​/​n​a​g​e​s​h​s​i​n​g​h​/​d​n​a​-​s​e​q​u​e​n​c​e​-​d​a​t​a​set L'ensemble des fichiers néces­saire à cet article sont dis­po­nibles ici. Vous trou­ve­rez dans ce lot de don­nées un ensemble de séquences d’ADN issues de 3 espèces : l’homme, le chien et le chim­pan­zé. Cha­cune de ces séquences appar­tient à une des 7 familles de…

  • Bioinformatique et IA : un premier pas

    Bioinformatique et IA : un premier pas

    Intelligence Artificielle, Machine Learning, Deep-Learning, quid du Data-Scientist Intel­li­gence arti­fi­cielle (IA), Machine lear­ning (Appren­tis­sage machine, pour les fran­co­phones), Deep-lear­ning (Appren­tis­sage pro­fond), autant de termes si étran­gers et fami­liers à la fois… Com­ment se retrou­ver dans cette jungle de termes tech­niques ? Com­men­çons par défi­nir ce qu'est l'IA. Base de science-fic­tion pour cer­tains, source d'inquiétudes pour d'autres,…

  • Fréquences des dinucléotides dans le génome d'organismes modèles

    Fréquences des dinucléotides dans le génome d'organismes modèles

    L'analyse de séquences est au cœur de nom­breux domaines de la bio-infor­ma­tique. Le billet du jour s'intéressera aux séquences ADN, en se pro­po­sant de comp­ter la fré­quence en dinu­cléo­tides dans quelques génomes d'organismes modèles (avec une petite arrière-pen­sée der­rière la tête). Qu'est-ce qu'un dinucléotide ? L'ADN double brins est clas­si­que­ment struc­tu­ré sous forme de double hélice,…

  • Manipulation d'intervalles génomiques dans R

    Manipulation d'intervalles génomiques dans R

    Introduction Nous avons abor­dé, dans le pré­cé­dent article de cette série, les bases de la mani­pu­la­tion d'intervalles dans R. Ce deuxième article a pour objec­tif de mon­trer com­ment mani­pu­ler des inter­valles géno­miques. Au niveau le plus basique, un inter­valle est défi­ni par deux nombres entiers posi­tifs déli­mi­tant son début et sa fin. Nous allons pou­voir…

  • Introduction à la manipulation d'intervalles dans R

    Introduction à la manipulation d'intervalles dans R

    Introduction "Quelle est la pro­fon­deur de ce séquen­çage ?" "Quelle pro­por­tion de SNPs se situent dans des exons ?" "Y a‑t-il des pics dans ces don­nées de ChIP-seq ?" "Quelle pro­por­tion de pro­mo­teurs che­vauchent des îlots CpG ?" Voi­là le genre de ques­tions ren­con­trées fré­quem­ment en bio­in­for­ma­tique. Nous pou­vons y répondre à l'aide de la…

  • Qu'est ce qu'un TAD ? (Topological associated domain)

    Qu'est ce qu'un TAD ? (Topological associated domain)

    Dans l'article pré­cé­dent, j'ai par­lé des dif­fé­rentes échelles d'organisation de la chro­ma­tine mais me suis attar­dé sur les éche­lons les plus grands. Cette obser­va­tion glo­bale de la carte a alors per­mis de défi­nir la notion de com­par­ti­ment géno­mique. Mais com­ment l'ADN s'organise loca­le­ment ? Qu'observe-t-on sur une carte de contact chro­mo­so­mique en zoo­mant fine­ment sur une…