Ne devenez pas un dinosaures : adoptez un copilot !

2 octobre 2024

par

Mot des admins

Ce post est un article d'opinion qui n'engage que l'avis de son auteur.

Sauf si vous vivez dans une grotte, sur une planète sans ordinateur ni télévision, le terme ChatGPT doit maintenant résonner à vos oreilles comme le dernier jouet à la mode.

Après avoir fait des ravages considérables dans le domaine du traitement du langage, de l'imagerie et de nombreux autres domaines, le Deep Learning est en train de bouleverser durablement notre quotidien avec le nouveau cycle de la révolution : l'IA générative. Aujourd'hui, j'aimerais aborder avec vous plusieurs points. En commençant par la manière dont je perçois la recherche académique sur l'IA générative, j'aimerais ensuite mettre en avant un outil qui, je pense, est en train de devenir incontournable pour nos usages : Copilot. Enfin, pour ouvrir la discussion, j'aimerais évoquer avec vous tous les usages amusants que nous pourrions faire de ces outils et que j'ai hâte de voir se concrétiser.

Petit disclaimer habituel : ces derniers mois, j'ai publié sur ce blog de nombreux articles d'opinion. Comme à chaque fois, ces mots ne reflètent que ma pensée à un instant T. Je ne suis ni Dieu, ni un grand maître de la connaissance. Simplement une personne curieuse qui aime partager le peu de savoir qu'elle accumule. De plus, je me considère comme relativement débutant dans le domaine de l'IA générative, n'ayant pas autant de temps que je le souhaiterais pour en exploiter pleinement le potentiel.

Opinion divergente : la recherche est à la traîne sur le genIA

En janvier, j'assistais à la journée sur l'IA générative et la bio-informatique. Après lecture des résultats du sondage qui en a découlé, j'aimerais partager une opinion radicalement différente de la majorité des participants. Pourquoi ? Car je ne faisais pas partie de cette majorité, loin de là.

Quand on observe les questions que se posent les chercheurs aujourd'hui, on constate que la principale est : comment mes étudiants vont-ils l'utiliser ? Une caricature un peu facile et de mauvaise foi résumerait cette interrogation à : « Mes étudiants vont-ils devenir idiots à force d'utiliser un outil qui ne les oblige plus à réfléchir ? » Et c'est ainsi qu'une conférence sur l'IA générative et la bio-informatique a fini par se concentrer sur toutes les questions que cela soulève dans l'enseignement. Certes, ces questions sont pertinentes car il n'est ni possible (ni souhaitable) d'interdire l'usage d'un nouvel outil. Mais est-ce vraiment le seul sujet qui mérite d'être abordé ? J'ai eu le sentiment, malheureusement, que comme l'accès à ces technologies est souvent payant, les chercheurs ont eu des difficultés à s'y essayer et se sont pour la plupart contentés de tester la version gratuite de ChatGPT sans penser aux formidables possibilités qui s'ouvrent peu à peu à nous et qui vont transformer nos pratiques. De mon point de vue, en tant que personne ayant eu la chance d'avoir rapidement accès à ces outils, j'étais frustré de voir des personnes que je considérais comme éclairées en train de rattraper leur retard sur le sujet.

Aujourd'hui, les grandes entreprises se sont toutes mises massivement à utiliser ChatGPT et les autres outils d'IA générative. Elles l'ont probablement fait par peur de perdre un avantage concurrentiel face à une telle puissance. Il est intéressant de noter que la connaissance de l'IA générative figure désormais parmi les compétences requises pour de nombreux postes en dehors du milieu académique. Ces outils s'imposent comme une nouvelle norme, une compétence à maîtriser.

Copilot : pourquoi l'utiliser et pas chatGPT ?

Actuellement, si vous suivez de près les EXCELLENTES chaînes de vulgarisation sur l'IA générative, vous avez sans doute remarqué l'émergence d'une multitude d'outils. Parmi ceux-ci, j'aimerais aujourd'hui vous parler de Copilot, la version « code » de ChatGPT proposée par GitHub. Cet outil se veut être, comme son nom l'indique, un copilote pour nous assister dans nos tâches de programmation. Le principal avantage qu'il présente par rapport à ChatGPT est qu'il est conçu pour coder sans avoir besoin d'un "prompt" pour l'orienter mais se base principalement sur le code qu'on lui donne. Les prompts sont en fait déjà pré-écris dans les différentes options de bases pour répondre à des usages communs : commenter un code, le comprendre.

J'apprécie beaucoup utiliser ChatGPT pour éviter de solliciter constamment mes collègues pour des questions triviales. La méthode du canard en plastique étant un de mes besoins principaux au quotidien, il devient mon premier interlocuteur quand j'ai du mal à poser un problème. Cependant, il faut reconnaître que Copilot va encore plus loin. Pour l'utiliser, il est nécessaire de posséder un compte GitHub et de payer pour cette extension (ce qui peut être un frein pour la recherche de rajouter 10 euros de facture mensuelle par personne, effectivement…). Ensuite, la seconde étape consiste à l'intégrer à un éditeur de code qui le supporte que tel que Visual Studio Code. Après avoir installé l'extension Copilot sur cet éditeur, vous êtes prêt à l'utiliser.

Voyons ensemble les trois fonctionnalités principales. Pour des raisons évidentes de confidentialité liées à mon travail actuel, je vais illustrer mon propos avec des exemples tirés au hasard dans mes vieux codes.

Comprendre le code : Oh Léopold du passé, toi qui a écrit un bout de code vachement bien il y a 2 ans… mais… il fait quoi déjà ? Pourquoi j'ai écris ces lignes ? Oh toi Léopold qui a la flemme et prend un code de quelqu'un d'autre… mais pourquoi il a écrit ça… à quoi sa sert ?

Vous vous reconnaissez dans cet exemple ? Dans ce cas, depuis l'invite de code, il suffit de cliquer sur 'explique moi ce code' et lui demander très poliment, et hop, il génère une explication très claire. Cette fonctionnalité semble être redoutable même dans les pires cas de code pas clair donc TRÈS utile !

Commenter le code : MAIS QUI A COMMENTÉ AUSSI MAL CE CODE ? Ah oui moi. Bon le code marche, est-ce que j'ai vraiment envie de passer du temps à le commenter ? Aller, demandons à Copilot de le faire. Pour ce coup il suffit de cliquer sur le bouton 'générer les documents'.

Et bim, une jolie signature de fonction toute propre ce qui est soyons sincère, le minimum syndical qui manquait dans la publication précédente.

Voila ce que mon bon Copilot a ajouté au début de ma fonction :

"""

Size of windows in contact probability generator

Little bit tricky for complexity optimisation

VdT : index of every bin in Vs

Vs : Size of every probability bloc

"""

Ou comment ne plus passer de temps à écrire toutes les signatures des fonctions de tes codes ! Le faire sur un fichier de code entier pour toute les fonctions marche pour les plus curieux !

Coder à sa place : Autre cas d'usage très simple. Aujourd'hui j'ai une fonction simple à écrire mais j'ai alors vraiment, mais vraiment pas envie d'écrire comme un robot les 10 lignes de codes que je dois écrire.

Je vais alors écrire la signature de ma fonction un petit peu rapidement comme ceci, ouvrir le Copilot et lui dire 'écris moi le code'. Et là, magie la fonction est écrite.

Alors oui j'ai écris un exemple assez simple et pas forcement plus pertinent, mais il était largement suffisant montrer le potentiel de l'outil.

Vous l'aurez compris, je montre ici des usages simples qui sont principalement un gain de temps considérable sur des petites tâches du quotidien que nous avons tous effectuées pendant des dizaines d'heures. Copilot est vendu tel quel : il ne fera pas votre travail, mais il vous rendra plus productif dans ce que vous savez faire. À mon sens, il faut utiliser ces outils dans cette direction : simplifier le travail et les utiliser comme des assistants pour les parties les plus simples. Demander à chatGPT d'écrire un code complexe fonctionnera dans la plupart des cas, mais si vous n'en comprenez pas un traître mot, cela finira par devenir un obstacle pour vous. Avec Copilot, le risque est le même, c'est pourquoi il est essentiel de savoir faire ou reproduire tout ce qu'il aurait pu écrire (comme tout chef de projet quand il demande du renfort hum…). La seule différence est que, pour le faire, vous n'aurez pas à lire toutes les pages de documentation que vous avez oubliées.

Le futur est en marche, alors marchons !

Oh mes très chers amis bioinformaticiens, entendez mon appel. Quand aurons-nous un chatGPT entraîné sur l'ensemble des réseaux métaboliques de l'univers ? Pour ceux qui ne le savent pas, ces IA sont très fortes pour produire du texte cohérent avec un contexte donné. Il est donc possible de donner 'à manger' à un chatGPT un gros ensemble de bibliographie et lui en demander un résumé. En général, ça fait à peu près le job (même si parfois ça te dit qu'un chercheur X ou Y est un expert d'un domaine… qu'il ne connaît pas). Au-delà des problèmes d'hallucinations qui sont un sujet entier, on comprend assez vite que ces modèles peuvent accumuler une grande quantité de connaissances et nous servir de base de réflexion moyennement pas trop mauvaise (et surtout, plus rapide qu'un mois à lire des papiers).

On pourrait alors lui demander : "J'ai vu que dans mon analyse RNA-seq ce gène ressort, a-t-il du sens ?", "Si je supprime ce gène de mon analyse, que se passera-t-il ?". Où sont les rêves de tout ce que nous pourrons construire pour comprendre le lien entre différentes omiques ?

À quand des conférences où l'on verra toutes les données publiques mises dans des chatGPT demander des explications sur le sens d'une molécule X ou Y dans un collègue de poche ? (Oui, je veux mon biologiste de poche plutôt que parler a un être humain ~~casse pied~~ plein de savoir). Si on met toutes les publications scientifiques sur la chromatine dans un chatGPT, aura-t-on enfin quelqu'un qui comprend quelque chose à ma protéine d'intérêt ?

Si aujourd'hui nous en sommes collectivement à comprendre comment l'usage de chatGPT et de ses concurrents impacte notre quotidien, à quand un usage ultra massif dans nos questions scientifiques ? Voilà ce que j'aurais rêvé au début de ma raillerie de jeune vieux grincheux impatient sur l'état de notre communauté.

Qu'on soit très clair, je n'écris pas cet article pour critiquer qui que ce soit. Ces lignes ne sont que l'expression d'un ressenti, celui de ma peur. Aujourd'hui, je pense que le train est en marche, que les plus curieux et les plus anxieux ont pris ce train. Mais demain, ceux qui n'ont pas pris ce train auront alors de sérieuses difficultés. Je ne souhaite qu'une chose, encourager la communauté à faire ce bond et prendre pleinement conscience que les outils mis à notre disposition deviennent une nouvelle norme.

Alors à tous ceux qui ont un jour prêché qu'internet ne serait pas une révolution et à tous ceux qui se sont jetés dedans à corps perdu, je vous souhaite une bonne évolution professionnelle.

P.S. : Cet article, comme tous mes autres articles depuis 1 an, a été relu en premier par chatGPT pour corriger l'orthographe et apaiser les supers relecteurs de cette charge 🙂

Merci aux relecteurs : Ista, Pierre Marijon, Azerin

Merci a notre chère admin : Zazo0o

Auteur / autrice

Léopold Carron

Bioinformaticien de formation ayant complété son cursus par un master de machine learning appliqué aux langues à Nantes. Après une thèse et postdoc à la Sorbonne, je suis maintenant data scientist. J'aime python, le machine learning et analyser des données !

Voir toutes les publications

Partagez cet article

AI chatGPT copilot programmation Recherche

Pour continuer la lecture :

Commentaires

11 réponses à “Ne devenez pas un dinosaures : adoptez un copilot !”

Pierre Legrand

2 octobre 2024

Pourquoi je ne l'utilise pas ? l’empreinte environnementale de l’IA de trop grand.

Répondre
carron léopold

2 octobre 2024

Bonjour pierre, merci pour ton retour, as tu regarder les options tel que mystral tout a fait viable d'un point de vue écologique ?
Je comprend l'enjeu écologique et pense qu'il y a des options qui existent en ce sens (au delà de cet article volontairement provocateur pour faire réfléchir sur le sujet 🙂 ).

Répondre
robert denis

2 octobre 2024

Article franchement caricatural . D'une part, ce genre d'IA produit des résultats certes efficaces mais au prix d'un pompage totalement illégale des contenus extraits en ligne, ce sans la moindre compensation versée aux auteurs quand le droit de propriété s'applique.
L'utiliser c'est valider cette pratique.
D'autre part, ce type d'IA détruit bien plus l'activité économique qu'elle le renforce. En reprenant l'exemple avec le fait de disposer de ton biologiste de poche au détriment d'un scientifique, cela te permettra certes de t'éviter à avoir à aller solliciter ce dernier pour obtenir directement ta réponse. Néanmoins ce n'est pas ton IA qui fait marcher en coulisse toute la machinerie nécessaire pour éprouver et valider un contenu scientifique. Travail qui nécessite un bon paquet d'êtres humains derrière pour assurer que le contenu scientifique disponible à tout lecteur soit valide et idéalement consensuelle. Cet IA ne fait que repomper le produit de tout ce travail.

je préfère privilégier l'utilisation d'IA en tant que support à une activité plutot que de remplacer un être humain qui participe au tissu économique d'un pays. Newton en est un bon exemple

Répondre

carron léopold

2 octobre 2024

Bonjour Denis, ne crois tu pas que la caricature a été poussé exprès pour amener le débat ? 🙂

Répondre

Pierre Marijon

3 octobre 2024

Je trouve que tu tiens là une position un peu trop facile Léopold.

Tu rédiges un article d'opinion on peut donc s'attendre a ce que tu écris dans ce billet soi ton opinion. Dès qu'on critique l'opinion exprimée (peut-être de manière un peu rustique) plus tôt que défendre cette opinion tu te réfugies derrière la caricature. D'autant plus que j'ai lu plusieurs fois ce billet de blog et j'ai du mal a y trouver des aspects caricaturaux.

Admettons tu as écrit ce billet pour susciter le débat, il ne reflète pas entièrement ton opinion (ce que je trouve mal honnête) tu cherches suscité le débat. Mais pour le coup tu ne réponds à aucun des points abordé par Denis, donc tu débats assez peut. Alors Denis n'a pas été cordial mais toi non plus vue que tu a avancé masqué.

J'ai écrit un billet en réponse a celui-ci qui sera publié la semaine prochaine, je peux défendre tous les points abordés et les défendrais ou les renierais si jamais on me convainc qu'ils ne sont pas ou plus bon.

Répondre

Carron leopold

3 octobre 2024

Salut Pierre !

Ne devenez pas un dinosaure : adoptez un copilote !

Opinion divergente : la recherche est à la traîne sur la génération d'IA.

Alors, à tous ceux qui ont un jour prêché qu'Internet ne serait pas une révolution, et à tous ceux qui s'y sont jetés à corps perdu, je vous souhaite une bonne évolution professionnelle.

=> "Caricatural" n'est peut-être pas le mot le plus adéquat, mais il est raisonnable de dire que j'ai volontairement utilisé des mots provocateurs. C'est en cela que j'estime avoir poussé un peu fort pour lancer le débat. En toute franchise, je ne m'attendais pas à ce que ça marche aussi bien, et ma première réaction humaine a été d'être… content de voir des réactions. Moi qui appréhendais sincèrement la réception de ce billet, j'ai réagi… en étant très surpris, sans prendre le temps pleinement de commencer à répondre à chacun des avis qui sont apparus, mais plutôt en observant cette vague de réactions.

Concernant l'opinion de fond derrière le masque, l'article reflète assez sincèrement ce que je pense : il y a là une vraie révolution qu'il faut saisir, des évolutions notables, et une envie de voir où elle va mener… mais aussi une peur qui m'a poussé à me plonger dedans pour ne pas être largué. Ainsi qu'une frustration de voir la vitesse à laquelle les gens suivent. Peut-être une réaction du type "J'ai peur, mais eux ne font rien ?" sans doute.

Pour rentrer plus en détail sur les arguments de Denis, maintenant que c'est bon… une journée est passée et le monde n'a pas tremblé devant mon petit billet, reprenons calmement :
Je suis assez d'accord sur la partie illégale des entraînements, en fait. Par contre, pour le remplacement du tissu économique, malheureusement, comme toute révolution, elle est là, c'est trop tard : des gens l'utiliseront et gagneront avec. On pourrait passer des heures à débattre là-dessus, mais quelque part, pour moi, c'est un nouvel outil, comme le feu. À nous d'avoir l’intelligence de trouver l'usage le plus raisonnable (mieux vaut faire cuire des légumes que de la poudre à canon, non ?). Les métiers changent à chaque révolution et, en tant que data scientist, je me vois mal refuser un outil qui facilite mon travail, à condition d'avoir un regard critique sur son usage et de l'employer pour des tâches simples.

Et je suis convaincu qu'un "biologiste de poche" (une autre caricature, non ?) peut avoir quelques côtés pratiques, au moins en première intention, pour réfléchir, comprendre, et ensuite poser de meilleures questions à son collègue. Après tout, le biologiste aussi va utiliser des GPT pour aller plus vite dans son travail et devenir plus expert, non ?

À très vite sur ton article !

Répondre

Thomas

2 octobre 2024

Super article. Je rejoins ton avis Léopold sur l’utilisation de l’IA.
L’IA générative pose certes des problèmes aujourd’hui (écologiques, droits d’auteurs…) mais force est de constater que tous les jours de nouveaux outils apparaissent utilisant ces approches.
Je serais curieux d’avoir un retour sur les destruction de l’activité économique de ces IA. Mon point de vu est plutôt contraire, elles aides à améliorer la productivité mais jamais ne remplaceront pas l’humain.
À nous en tant que scientifiques de les appréhender de la meilleure des manières. Nous sommes que au début.

Répondre
paulimer

7 octobre 2024

Je trouve que cet article est un peu caricatural et confond deux cas très différents. D'une part l'usage du DL génératif dans le cadre d'un projet de recherche, de l'autre l'usage d'outils au quotidien comme copilot et chatgpt. Les deux n'ont rien à voir. Mettre des génomes, structures, annotations, images d'anapath.… dans des LLMs, ça existe déjà. Pas la peine de le vendre comme une limite auto-imposée de bioinformaticiens réfractaires.

D'autre part il y a l'usage de copilot et ChatGPT pour se simplifier la vie, qui à mon avis est le vrai sujet de ce blog. Et les limites autour des questions éthiques (ce sont des machines à plagiariser) et écologiques (les coûts d'inférence sont toujours très importants) de l'usage massif de ces outils, pourtant évidentes, ne sont pas abordées ici, ce que je trouve dommage. Son impact sur l'apprentissage est aussi un point important, et il faut probablement repenser l'enseignement maintenant que ce type d'outil est disponible, mais ce n'est pas un point en faveur de ces outils, à mon avis. Comme l'écrit (mieux que ChatGPT) Ted Chiang : "Using ChatGPT to complete assignments is like bringing a forklift into the weight room ; you will never improve your cognitive fitness that way" (https://www.newyorker.com/culture/the-weekend-essay/why-ai-isnt-going-to-make-art). Enfin il y a le côté social et économique : ces outils ne sont, il me semble, pas encore utilisés pour remplacer directement des travailleurs, ils sont plutôt utilisé pour les déqualifier, leur poste passant d'artiste/animateur/développeur à un poste de rectificateur d'IA.

Répondre
léopold carron

9 octobre 2024

Bonjour paulimer, merci pour ton retour, je t'invite a regarder le nouvel article sorti, tout aussi caricatural que le mien et qui sont.. peu être.. volontairement marqué sur deux extrêmes. Les sujets que tu évoques y sont abordés :).

'Mettre des génomes, structures, annotations, images d'anapath.… dans des LLMs, ça existe déjà. Pas la peine de le vendre comme une limite auto-imposée de bioinformaticiens réfractaires.' => Oui certes, je ne fais qu'exprimer mon regret quand je voie des meeting autour du GenIA avec pour titre 'IA génératives : apports et limites de leur utilisation en bioinformatique' parler uniquement des aspects 'ChatGPT pour les étudiants c'est pas bien' plutôt que de parler de toutes ces techniques. Le temps de réflexion autour de ces sujets est un peu a deux vitesses et c'est sur ce constat humain que j'insiste. Le propos n'es pas nuancé volontairement dans un but d'alerter cette vitesse moindre. Cet article est loin d'être complet et même après celui de mon collègue il manque cette partie la qui mériterais un article entier et dédier.. hum… c'est une bonne idée de sujet!!!

A très vite
Léopold

Répondre
1. Pierre Marijon
  
  9 octobre 2024
  
  Bon billet serais caricaturale ? A bon ?
  
  Répondre
Julien FOURET

6 décembre 2024

Hello,

Je pense que c'est très positifs d'en parler ! Je ne rentrerai pas dans les
débats sur la capacité de réflexion ou le plagiat ou autres aspects déjà abordés
, mais j'aimerais apporter un commentaire (avec bienveillance) sur la
souveraineté et la confidentialité de ces outils. C'est des notions importantes
et quand on décide d'utiliser des outils LLMs dans un contexte pro, il peut
être utile de ne pas partager nos données. En particulier sur VS code où il
peut rapidement y avoir des données sensible, en particulier dans notre domaine.

Plutôt que de discuter des notions de souveraineté et de confidentialité,
je voudrais parler d'une alternative à copilot qui permet de répondre,
en partie, à ces inquiétudes. Il s'agit de l'extension "continue"
(https://docs.continue.dev/) sur vs code qui offre la possibilité
d'utiliser d'autres modèles et d'autres fournisseurs dAPI y compris
local !

Pourquoi ?

De cette façon vous pouvez utiliser plusieurs modèles (par exemple comme
cité dans un commentaire d'un autre article : mistral).

Je pense que c'est important de ne pas être influencé autant par une seul
système qui se voudrait hégémonique.

Autre point encore, vous pouvez déploiement en local un LLM libre avec ollama
et combiné un modèle libre de votre choix avec une API local.

A terme pourrait-on rêver d'un modèle libre entraîné sur du code avec
l'autorisation des auteurs (par exemple que sur la base de code sous licence
MIT permettant la réutilisation sans reciter l'auteur)…

Il est intéressant aussi de se poser la question des ressources utilisées
pour entraîner et utiliser ces modèles et cela peut nous conduire à utiliser
un modèle plutôt qu'un autre… C'est bien d'en avoir la liberté.

Ces notions de contenu utilisé pour l'entraînement et le coût environmental
sont de plus en plus présents sur certaines fiches de LLM par ailleurs.

Répondre

Laisser un commentaireAnnuler la réponse.

Pour insérer du code dans vos commentaires, utilisez les balises <code> et <\code>.

Ne devenez pas un dinosaures : adoptez un copilot !

Opinion divergente : la recherche est à la traîne sur le genIA

Copilot : pourquoi l'utiliser et pas chatGPT ?

Le futur est en marche, alors marchons !

Auteur /​ autrice

Pour continuer la lecture :

Commentaires

11 réponses à “Ne devenez pas un dinosaures : adoptez un copilot !”

Laisser un commentaireAnnuler la réponse.

Auteur / autrice