Étiquette : data science
-
IA et bioinformatique : exploitons les réseaux convolutionnels (CNN)
Interessons-nous aujourd'hui aux séquences d’ADN. Nous utiliserons le dataset téléchargeable ici : https://www.kaggle.com/datasets/nageshsingh/dna-sequence-dataset L'ensemble des fichiers nécessaire à cet article sont disponibles ici. Vous trouverez dans ce lot de données un ensemble de séquences d’ADN issues de 3 espèces : l’homme, le chien et le chimpanzé. Chacune de ces séquences appartient à une des 7 familles de…
-
Bioinformatique et IA : un premier pas
Intelligence Artificielle, Machine Learning, Deep-Learning, quid du Data-Scientist Intelligence artificielle (IA), Machine learning (Apprentissage machine, pour les francophones), Deep-learning (Apprentissage profond), autant de termes si étrangers et familiers à la fois… Comment se retrouver dans cette jungle de termes techniques ? Commençons par définir ce qu'est l'IA. Base de science-fiction pour certains, source d'inquiétudes pour d'autres,…
-
De bioinformaticien à data scientist, un simple pas ?
Nombreux parmi nous se retrouvent un jour en fin de master/thèse ou postdoc de bioinformatique. A ce moment là, dans les difficultés de la recherche d'emplois on vient à se demander : "Et si je postulais à toutes ces offres de data scientist ?"Dans ces lignes, je vais donner mon avis de manière libre, sur pourquoi…
-
La première carte de la diversité génétique des poissons publiée
Introduction En ce début d’année 2020, notre équipe* a publié la première carte mondiale de la diversité génétique des poissons d’eau de mer et d’eau douce. C’est un instrument important pour la préservation des espèces. Cette première carte est publiée dans la revue Nature Communications. Comme j’ai réalisé l’ensemble des analyses bio-informatiques, je me suis…
-
dplyr et le génome humain
Introduction Non, ne fuyez pas tout de suite, chers lecteurs, tout va s'éclaircir : dplyr, c’est plyr pour les data.frame (les tableaux de données). Attendez, j’y viens, plyr, c’est un package R pour appliquer (apply) des fonctions. Donc, dplyr (prononcez “diplir”), c’est un package R, pour appliquer des fonctions à un tableau de données. Et ça,…