Catégorie : Suivez l'guide

  • IA et bioinformatique : exploitons les réseaux convolutionnels (CNN)

    IA et bioinformatique : exploitons les réseaux convolutionnels (CNN)

    Inter­es­sons-nous aujourd'hui aux séquences d’ADN. Nous uti­li­se­rons le data­set télé­char­geable ici : https://​www​.kaggle​.com/​d​a​t​a​s​e​t​s​/​n​a​g​e​s​h​s​i​n​g​h​/​d​n​a​-​s​e​q​u​e​n​c​e​-​d​a​t​a​set L'ensemble des fichiers néces­saire à cet article sont dis­po­nibles ici. Vous trou­ve­rez dans ce lot de don­nées un ensemble de séquences d’ADN issues de 3 espèces : l’homme, le chien et le chim­pan­zé. Cha­cune de ces séquences appar­tient à une des 7 familles de…

  • Bioinformatique et IA : un premier pas

    Bioinformatique et IA : un premier pas

    Intelligence Artificielle, Machine Learning, Deep-Learning, quid du Data-Scientist Intel­li­gence arti­fi­cielle (IA), Machine lear­ning (Appren­tis­sage machine, pour les fran­co­phones), Deep-lear­ning (Appren­tis­sage pro­fond), autant de termes si étran­gers et fami­liers à la fois… Com­ment se retrou­ver dans cette jungle de termes tech­niques ? Com­men­çons par défi­nir ce qu'est l'IA. Base de science-fic­tion pour cer­tains, source d'inquiétudes pour d'autres,…

  • Fréquences des dinucléotides dans le génome d'organismes modèles

    Fréquences des dinucléotides dans le génome d'organismes modèles

    L'analyse de séquences est au cœur de nom­breux domaines de la bio-infor­ma­tique. Le billet du jour s'intéressera aux séquences ADN, en se pro­po­sant de comp­ter la fré­quence en dinu­cléo­tides dans quelques génomes d'organismes modèles (avec une petite arrière-pen­sée der­rière la tête). Qu'est-ce qu'un dinucléotide ? L'ADN double brins est clas­si­que­ment struc­tu­ré sous forme de double hélice,…

  • Manipulation d'intervalles génomiques dans R

    Manipulation d'intervalles génomiques dans R

    Introduction Nous avons abor­dé, dans le pré­cé­dent article de cette série, les bases de la mani­pu­la­tion d'intervalles dans R. Ce deuxième article a pour objec­tif de mon­trer com­ment mani­pu­ler des inter­valles géno­miques. Au niveau le plus basique, un inter­valle est défi­ni par deux nombres entiers posi­tifs déli­mi­tant son début et sa fin. Nous allons pou­voir…

  • Introduction à la manipulation d'intervalles dans R

    Introduction à la manipulation d'intervalles dans R

    Introduction "Quelle est la pro­fon­deur de ce séquen­çage ?" "Quelle pro­por­tion de SNPs se situent dans des exons ?" "Y a‑t-il des pics dans ces don­nées de ChIP-seq ?" "Quelle pro­por­tion de pro­mo­teurs che­vauchent des îlots CpG ?" Voi­là le genre de ques­tions ren­con­trées fré­quem­ment en bio­in­for­ma­tique. Nous pou­vons y répondre à l'aide de la…

  • Qu'est ce qu'un TAD ? (Topological associated domain)

    Qu'est ce qu'un TAD ? (Topological associated domain)

    Dans l'article pré­cé­dent, j'ai par­lé des dif­fé­rentes échelles d'organisation de la chro­ma­tine mais me suis attar­dé sur les éche­lons les plus grands. Cette obser­va­tion glo­bale de la carte a alors per­mis de défi­nir la notion de com­par­ti­ment géno­mique. Mais com­ment l'ADN s'organise loca­le­ment ? Qu'observe-t-on sur une carte de contact chro­mo­so­mique en zoo­mant fine­ment sur une…

  • Qu'est-ce qu'un compartiment génomique ?

    Qu'est-ce qu'un compartiment génomique ?

    Cette ques­tion est la pre­mière que m'a posé mon jury de thèse lors de ma sou­te­nance. Aujourd'hui, je vous pro­pose d'y répondre le plus sim­ple­ment pos­sible. Pour com­prendre cet article, il est pro­ba­ble­ment néces­saire de connaître les bases du Hi‑C, déjà résu­mées par votre humble ser­vi­teur en visua­li­sa­tion, ou en ana­lyse sur ce blog au…

  • Télécharger des données de séquençage sur le NCBI.. pour les débutants !

    Télécharger des données de séquençage sur le NCBI.. pour les débutants !

    Toi petit étu­diant de M1 qui arrive en pre­mier jour de stage… Viens par ici… Oui TOI ! Toi à qui ton maître de stage te demande de récu­pé­rer les don­nées de séquen­çage d'un article vache­ment bien, sans que tu saches le faire… TOI ! Toi le phy­si­cien qui se met à la bio­lo­gie mais qui ignore…

  • La data visualisation sans aucune compétence en programmation (et en graphisme)

    La data visualisation sans aucune compétence en programmation (et en graphisme)

    Aujourd'hui, la visua­li­sa­tion des don­nées est une chose qui est com­plè­te­ment inté­grée dans notre quo­ti­dien. Que cela soit dans notre vie de tous les jours ou dans notre uni­vers pro­fes­sion­nel. Pas un jour ne passe sans que nous soyons confron­tés à une repré­sen­ta­tion visuelle d'une enquête, d'un son­dage, d'une suc­ces­sion d'événements chro­no­lo­giques ou non. C'est…