Étiquette : data science

  • IA et bioinformatique : exploitons les réseaux convolutionnels (CNN)

    IA et bioinformatique : exploitons les réseaux convolutionnels (CNN)

    Inter­es­sons-nous aujourd'hui aux séquences d’ADN. Nous uti­li­se­rons le data­set télé­char­geable ici : https://​www​.kaggle​.com/​d​a​t​a​s​e​t​s​/​n​a​g​e​s​h​s​i​n​g​h​/​d​n​a​-​s​e​q​u​e​n​c​e​-​d​a​t​a​set L'ensemble des fichiers néces­saire à cet article sont dis­po­nibles ici. Vous trou­ve­rez dans ce lot de don­nées un ensemble de séquences d’ADN issues de 3 espèces : l’homme, le chien et le chim­pan­zé. Cha­cune de ces séquences appar­tient à une des 7 familles de…

  • Bioinformatique et IA : un premier pas

    Bioinformatique et IA : un premier pas

    Intelligence Artificielle, Machine Learning, Deep-Learning, quid du Data-Scientist Intel­li­gence arti­fi­cielle (IA), Machine lear­ning (Appren­tis­sage machine, pour les fran­co­phones), Deep-lear­ning (Appren­tis­sage pro­fond), autant de termes si étran­gers et fami­liers à la fois… Com­ment se retrou­ver dans cette jungle de termes tech­niques ? Com­men­çons par défi­nir ce qu'est l'IA. Base de science-fic­tion pour cer­tains, source d'inquiétudes pour d'autres,…

  • De bioinformaticien à data scientist, un simple pas ?

    De bioinformaticien à data scientist, un simple pas ?

    Nom­breux par­mi nous se retrouvent un jour en fin de master/​thèse ou post­doc de bio­in­for­ma­tique. A ce moment là, dans les dif­fi­cul­tés de la recherche d'emplois on vient à se deman­der : "Et si je pos­tu­lais à toutes ces offres de data scien­tist ?"Dans ces lignes, je vais don­ner mon avis de manière libre, sur pour­quoi…

  • La première carte de la diversité génétique des poissons publiée

    La première carte de la diversité génétique des poissons publiée

    Introduction En ce début d’année 2020, notre équipe* a publié la pre­mière carte mon­diale de la diver­si­té géné­tique des pois­sons d’eau de mer et d’eau douce. C’est un ins­tru­ment impor­tant pour la pré­ser­va­tion des espèces. Cette pre­mière carte est publiée dans la revue Nature Com­mu­ni­ca­tions. Comme j’ai réa­li­sé l’ensemble des ana­lyses bio-infor­ma­tiques, je me suis…

  • dplyr et le génome humain

    dplyr et le génome humain

    Introduction Non, ne fuyez pas tout de suite, chers lec­teurs, tout va s'éclaircir : dplyr, c’est plyr pour les data.frame (les tableaux de don­nées). Atten­dez, j’y viens, plyr, c’est un package R pour appli­quer (apply) des fonc­tions. Donc, dplyr (pro­non­cez “diplir”), c’est un package R, pour appli­quer des fonc­tions à un tableau de don­nées. Et ça,…