Les arbres phylogénétiques : construction et interprétation

Jor­don Cooper /​ CC BY-NC-SA

Après avoir dis­cu­té des ali­gne­ments mul­tiples (MSA), il s'avérait logique de vous pré­sen­ter l'étape sui­vante : la construc­tion d'arbres phy­lo­gé­né­tiques. Je pré­cise que je ne par­le­rai ici que de phy­lo­gé­nie molé­cu­laire.

Le but de la phy­lo­gé­nie est de com­prendre les rela­tions de paren­té, de retra­cer l’historique évo­lu­tif d’un gène, d’une famille de gènes ou d’une espèce. Les arbres phy­lo­gé­né­tiques sont une très bonne manière de sché­ma­ti­ser et d'appréhender ces rela­tions rapi­de­ment. Leur inter­pré­ta­tion est éga­le­ment assez aisée du moment que l'on connait leur nomen­cla­ture. Avant de vous expli­quer celle-ci, je me pen­che­rai donc d'abord sur com­ment les réa­li­ser.

Arbre phylogénétique : définition /​ petit rappel

Willi Hennig. Crédit : Wikipédia (CC-by-SA 3.0)
Willi Hen­nig. Cré­dit : Wiki­pé­dia (CC-by-SA 3.0)

His­to­ri­que­ment, les pre­mières per­sonnes ayant démo­cra­ti­sé la visua­li­sa­tion sous forme d'arbre sont les généa­lo­gistes et les natu­ra­listes. De plus, Charles Dar­win les réuti­li­sa allè­gre­ment en 1859 dans son ouvrage deve­nu réfé­rence De l'origine des espèces. Mais si l'on cherche le pré­cur­seur his­to­rique, c'est en réa­li­té Willi Hen­nig, père de la cla­dis­tique, qui a réus­si à démo­cra­ti­ser les arbres phy­lo­gé­niques.

Comme en généa­lo­gie où les arbres sont uti­li­sés pour visua­li­ser les rela­tions de paren­té, les arbres sont un très bon moyen de faire res­sor­tir l'évolution d'une ou plu­sieurs espèces.

Atten­tion, cela ne veut abso­lu­ment pas dire que généa­lo­gistes et évo­lu­tion­nistes uti­lisent les arbres de la même manière : ils se servent juste du même moyen de visua­li­sa­tion. Nous décou­vri­rons plus loin com­ment inter­pré­ter un arbre phy­lo­gé­nique.

Comment générer un arbre phylogénique ?

Avant de géné­rer un arbre phy­lo­gé­nique, il faut savoir ce que l'on cherche à voir/​à mon­trer et se poser les bonnes ques­tions. La pre­mière de ces ques­tions est de savoir si la visua­li­sa­tion en arbre est la meilleure pour nos don­nées. En effet, cela ne sert à rien de vou­loir construire un arbre si les séquences que l'on a en main sont trop éloi­gnées en terme d'évolution. Mais si la réponse est oui, il faut alors consi­dé­rer le degré de pré­ci­sion dési­ré : cherche-t-on à obte­nir une phy­lo­gé­nie rigou­reuse ou sim­ple­ment à 'se faire une idée' sur nos don­nées ? En effet, en fonc­tion des besoins, plu­sieurs méthodes de géné­ra­tion d'arbres employant dif­fé­rents algo­rithmes existent et peuvent être uti­li­sées.

S'appuyer sur des méthodes connues

Outils. Crédit : zzpza sur Flickr (CC-by 2.0)
Outils. Cré­dit : zzp­za sur Fli­ckr (CC-by 2.0)

Voi­ci un aper­çu de ces méthodes. J'aurai pu faire le choix de toutes les détailler mais la taille de l'article aurait été consé­quente et tout n'aurait pas for­cé­ment été trai­té. Il fau­drait un article sur chaque méthode pour bien sai­sir les sub­ti­li­tés de cha­cune d'entre elles. Cela vien­dra peut-être un jour, mais en atten­dant je vous laisse vous conten­ter de cette liste avec un petit résu­mé pour chaque méthode et un tableau réca­pi­tu­la­tif en fin de lis­ting :

la méthode UPGMA (Unweigh­ted Pair Group Method with Arith­me­tic Mean) est une méthode dite de dis­tance, c'est-à-dire une méthode basé sur les simi­la­ri­tés entre paires de séquences. Elle a vite été délais­sée au pro­fit de sa cou­sine (NJ) qui est plus adap­tée aux études phy­lo­gé­niques molé­cu­laires.

  • la méthode du Neigh­bour Joi­ning (Neigh­bor Joi­ning- NJ) : c'est aus­si une méthode de dis­tance, elle a l'avantage d'être vrai­ment rapide. En géné­ral, elle est uti­li­sée pour faire des arbres de plu­sieurs mil­liers de séquences.
  • la méthode du maxi­mum de vrai­sem­blance (Maxi­mum Like­li­hood- ML) : c'est une méthode dite de caractère(s), elle repose sur un ou plu­sieurs carac­tères à étu­dier. Il s'agit d'une méthode pro­ba­bi­liste qui néces­site un modèle d’évolution. Le choix de ce modèle est cru­cial pour la qua­li­té de l’arbre obte­nu. On dit qu'il convient de l'utiliser à par­tir du moment où le nombre de carac­tères ana­ly­sés est supé­rieur à la moi­tié du nombre de séquences ana­ly­sées, sinon la recons­truc­tion est consi­dé­rée comme incor­recte. Elle est sou­vent décrite comme étant la meilleure méthode, c'est-à-dire la plus effi­cace pour trou­ver l'arbre le plus proche de la réa­li­té. Son désa­van­tage se situe au niveau des temps de cal­culs qui sont extrê­me­ment longs (il m'est arri­vé d'avoir des jobs tour­nant sur le clus­ter pen­dant plu­sieurs semaines pour des fichiers conte­nant plu­sieurs cen­taines de séquences).

  • la méthode du maxi­mum de par­ci­mo­nie  (Maxi­mum Par­ci­mo­ny) : elle est très appré­ciée car rapide en temps de cal­cul, mais pas aus­si pré­cise que sa cou­sine (ML). Comme sou­vent donc, on gagne du temps de cal­cul mais on perd de la pré­ci­sion.

D'autres méthodes appa­raissent régu­liè­re­ment comme celles basées sur de l'apprentissage arti­fi­ciel (via un réseau de neu­rones comme ici ou par exemple) ou encore de l'inférence bayé­sienne comme  dans le logi­ciel MrBayes qui est très uti­li­sé. Néan­moins, les méthodes prin­ci­pa­le­ment uti­li­sées res­tent la NJ et la ML.

Quand utiliser ces méthodes ?

Cré­dit : Yoann M. (CC-by-SA 3.0)

Toutes les méthodes énon­cées plus haut peuvent (et je dirais même doivent) être com­plé­tées par un boots­tra­ping (boots­trap). Il s'agit d'un déri­vé des simu­la­tions de Monte-Car­lo, qui consiste à échan­tillon­ner les posi­tions de l'alignement pour relan­cer la construc­tion phy­lo­gé­né­tique de façon ité­ra­tive puis de com­pa­rer les résul­tats obte­nus après 10, 100, 5000 répé­ti­tions. Il s'agit ici d'estimer la robus­tesse d'une phy­lo­gé­nie. Vous pour­rez ain­si voir appa­raître entre chaque branche de votre arbre une valeur de boots­trap (de 0 à 100%) tra­dui­sant le nombre de fois où cette branche a été retrou­vée au fil des répé­ti­tions et juger ain­si de leur cré­di­bi­li­té. On dit en géné­ral qu'une valeur en des­sous de 95 n'est pas à prendre en compte. Sui­vant les cas, on pour­ra revoir ce seuil (cut-off) à la baisse et bien sou­vent on se conten­te­ra d'un boots­trap d'environ 70 (plus ou moins).

Il fau­dra donc rete­nir ceci : vous devrez sélec­tion­ner votre méthode en fonc­tion de vos don­nées et de vos besoins. De même, le fac­teur temps peut ren­trer en jeu : peut-être vous deman­de­ra-t-on d'être plus rapide que pré­cis dans un pre­mier temps. Vous pri­vi­lé­gie­rez alors la méthode NJ à défaut de la ML qui serait pour­tant plus per­ti­nente.

Mon petit conseil dans ce cas là : lan­cez les deux géné­ra­tions d'arbres avec les deux méthodes dif­fé­rentes en même temps, vous obtien­drez le résul­tat NJ en pre­mier et pour­rez vous débrouiller gros­siè­re­ment avec. Puis, lorsque le ML sera fini, vous pour­rez très bien com­pa­rer vos deux arbres (avec le magni­fique Tree­Jux­ta­po­ser par exemple) et avoir un résul­tat plus proche de la réa­li­té.

 Le fichier d'entrée (input)

Pour obte­nir un bel arbre final, il est impor­tant de s'assurer tout d'abord de la qua­li­té de l'alignement que l'on four­ni en entrée. Il est donc pri­mor­dial de véri­fier que votre ali­gne­ment est bien réa­li­sé. Sans cela, votre arbre n'en sera que de plus mau­vaise qua­li­té et vos inter­pré­ta­tions le seront donc éga­le­ment.

Véri­fiez donc que ce que vous avez ali­gné (ADN ou acides ami­nés) est assez simi­laire et que l'alignement de ces séquences signi­fie bien quelque chose. En d'autres termes : si vous ali­gnez des séquences codant pour l'insuline chez le cha­meau avec des séquences liées à la pro­duc­tion de venin chez les ser­pents, ne soyez pas éton­nés de ne rien apprendre… 🙂

Encore une fois, j'insiste mais c'est utile, posez-vous les bonnes ques­tions : mon ali­gne­ment est-il assez bon (j'entends par là qu'il faut que les séquences aient suf­fi­sam­ment de simi­la­ri­té pour qu'on puisse sup­po­ser un lien d'homologie entre elles) ? Les espèces/​gènes/​protéines étu­diés sont-ils proches, très proches ou je n'en sais abso­lu­ment rien ? Un arbre m'apportera-t-il les réponses à mon pro­blème ?

Les formats de fichiers existants (output)

Deux for­mats de fichiers pré­do­minent dans la géné­ra­tion d'arbres phy­lo­gé­nique : le Nexus et le Newick. Que ce soit autant pour l'un que pour l'autre, les deux types de for­mats ne sont pas for­cé­ment très digestes quand on se plonge dedans. J'ai par ailleurs une petite pré­fé­rence pour le Newick. Même si au final le choix revient bien sou­vent au logi­ciel que l'on uti­lise pour visua­li­ser l'arbre et à sa capa­ci­té à lire l'un ou l'autre.

Le Nexus est orga­ni­sé en blocs. Chaque bloc com­mence de la sorte "begin <nom du bloc>;" et fini par "end;". En voi­ci un exemple :

Et voi­ci ce que donne l'arbre avec iTOL

Le Newick pour sa part ne pos­sède pas cette orga­ni­sa­tion en blocs et peut être écrit sur une seule et même ligne (par­fois donc très longue).

Voi­ci un exemple d'un fichier repré­sen­tant un arbre au for­mat Newick :

Et voi­ci ce que donne l'arbre avec iTOL 

Vous remar­que­rez sur ce der­nier la pré­sence d'une infor­ma­tion en plus : la lon­gueur des branches. Nous ver­rons com­ment l'interpréter plus loin.

Les logiciels utilisés pour la création d'arbres phylogéniques

Vous savez main­te­nant que l'on obtient un arbre à par­tir d'un ali­gne­ment qui a du sens, qu'il existe plu­sieurs méthodes de géné­ra­tion d'arbres et que le for­mat de sor­tie du fichier (out­put) n'est pas unique. Bien, main­te­nant il serait donc temps de s'intéresser à quel pro­gramme choi­sir.

Comme vous pou­vez vous en dou­ter, cela dépen­dra pre­miè­re­ment de la méthode que vous sou­hai­te­rez employer mais aus­si du for­mat de fichier que vous dési­re­rez en sor­tie (des conver­tis­seurs existent).

Les logi­ciels per­met­tant de géné­rer des arbres phy­lo­gé­niques sont légions (et pour la plu­part tous réfé­ren­cés sur cet excellent site). Je ne vais donc pas refaire ce tra­vail d'énumération mais plus vous orien­ter sur mes pré­fé­rés pour chaque méthode. Je vous invite bien enten­du à dis­cu­ter de ces choix en com­men­taire si vous le dési­rez.

Inté­res­sons-nous donc d'abord aux méthodes dites de dis­tances (géné­ra­le­ment la méthode NJ pour la plu­part) :

  • quick­tree , rapide et effi­cace. Il fait par­fai­te­ment le bou­lot. Gère très bien les grandes quan­ti­tés de séquences. Rien à redire.
  • MEGA (aus­si uti­li­sable en ML), un des pion­niers en la matière. Déjà bien décrit à la fin de cet article, je reste sur mes posi­tions et ne vous le conseille que pour des tout petits jeux de données…et encore.

  • Paup* (aus­si uti­li­sable en ML), payant. Je ne l'ai jamais uti­li­sé mais on en entend assez sou­vent par­ler.

  • PHYLIP (aus­si uti­li­sable en ML), éga­le­ment un des vieux de la vieille. A fait ses preuves.

  • BioNJ se com­bine à Paup ou/​et PHYLIP. De bons retours éga­le­ment.

Puis pour les méthodes dites de carac­tères (ML, Par­ci­mo­nie) :

  • RaXML (ou RaXML­GUI pour ceux/​celles pré­fé­rant les clics), mon pré­fé­ré car il offre un grand nombre d'options pos­sibles et four­nit de très bons résul­tats. Essayez-le !
  • PHYML, au cas où RaXML ne vous aurait pas entiè­re­ment convain­cu.

  • PAML, fait le bou­lot éga­le­ment.

  • Porn* pour son nom, j'avoue ne jamais l'avoir essayé 🙂

Au final il se pour­rait éga­le­ment que vous fas­siez votre choix en fonc­tion des logi­ciels déjà ins­tal­lés sur votre machine ou votre clus­ter. Je pense qu'il faut sur­tout en essayer deux ou trois et com­pa­rer les résul­tats obte­nus avec vos jeux de don­nées avant d'en choi­sir un pour votre work­flow habi­tuel.

Comment visualiser son arbre ?

Question... Crédit : Tsahi Levent-Levi sur Flickr (CC-by 2.0)
Ques­tion… Cré­dit : Tsa­hi Levent-Levi sur Fli­ckr (CC-by 2.0)

Encore une fois, ici, le phy­lo­gé­niste est confron­té à des logi­ciels par dizaines. Le choix se fera essen­tiel­le­ment sur la capa­ci­té de ceux-ci à édi­ter les arbres affi­chés (cou­leurs, lon­gueurs des branches, noms, style d'arbre, etc), sur leur vitesse d’exécution mais aus­si sur l'esthétisme final de ceux-ci (un trait noir tout car­ré et mal fini n'aura aucune chance face à un trait tra­vaillé avec un petit jeu de lumière des­sus par exemple). Voi­ci donc une courte pré­sen­ta­tion de quelques logi­ciels de visualisation/​édition d'arbres :

  • Den­dro­scope (petit tuto­rial bien fait) donne des résul­tats assez sym­pas. Il est libre d'accès (vous devez juste deman­der l'autorisation sym­bo­lique de l'utiliser à l'auteur qui vous ren­ver­ra gen­ti­ment une clé). Encore une fois : l'essayer c'est l'adopter. Je ne vous join­drai pas de cap­tures d'écran, tout est sur le site offi­ciel.

Archaeop­te­ryx, un nom de dino­saure pour un logi­ciel de visua­li­sa­tion d'arbres évo­lu­tifs, quoi de plus nor­mal ? Il ne fait pas par­tie de mes pré­fé­rés en rai­son de son ren­du final sur lequel j'aurais pas mal à redire (très années 90) mais se démarque assez sur sa capa­ci­té à édi­ter votre arbre via l'interface. À essayer éga­le­ment.

  • Tree­dyn, pour ne rien vous cacher je ne l'ai jamais uti­li­sé. Mais on m'en a dit que du bien. Appa­rem­ment on peut presque faire le café avec. J'attends volon­tiers vos retours si vous connais­sez la bête !

-iToL, ici rien besoin d'installer puisque tout se passe sur le ser­veur de l'EMBL. Un outil mer­veilleux auto­ri­sant pas mal de choses et qui est très facile à prendre en main. Essayez-le vite !

Comment interpréter ce que l'on voit ?

Il faut d'abord savoir ce que l'on cherche…

Ce n'est donc pas vrai­ment pos­sible de faire un manuel du par­fait petit géné­ra­teur d'arbres phy­lo­gé­niques de A à Z.

Nous allons donc voir les dif­fé­rentes choses qui peuvent être trai­tées à par­tir d'une visua­li­sa­tion d'arbre.

  • L'analyse à par­tir des valeurs de boots­trap : si vous avez sui­vi jusque-là, vous savez que la valeur du boots­trap pré­sente sur votre arbre est impor­tante. En effet, plus celle-ci sera éle­vée, plus la jonc­tion entre les deux branches étu­diées pour­ra être consi­dé­rée comme robuste.
  • L'analyse de la lon­gueur des branches : la lon­gueur des branches hori­zon­tales est pro­por­tion­nelle à la "quan­ti­té d'évolution" entre les séquences et leurs ancêtres (uni­té = nombre de substitutions/​site).  Sur un arbre phy­lo­gé­né­tique, les ancêtres sont repré­sen­tés par la jonc­tion des branches (2 branches ou plus). Donc, en gros, plus une branche sera longue plus les séquences cor­res­pon­dantes seront éloi­gnées en terme d'évolution par rap­port à son ancêtre et entre elles. En géné­ral, l'arbre s'assortit d'une échelle de dis­tance mais vous pou­vez bien sûr affi­cher la lon­gueur (com­prise entre 0 et 1 la plu­part du temps) sur les branches de l'arbre si c'est vrai­ment un cri­tère impor­tant pour votre étude.

  • Arbre enra­ci­né ou arbre non-enra­ci­né : il faut savoir qu'il est par­ti­cu­liè­re­ment dif­fi­cile d'orienter tem­po­rel­le­ment les dif­fé­rences par­mi les séquences et c'est pour cela que beau­coup de méthodes pro­duisent des arbres non-enra­ci­nés. Il existe cela dit plu­sieurs méthodes pour ten­ter d'enraciner un arbre phy­lo­gé­nique : on peut choi­sir d'introduire un groupe (une ou plu­sieurs séquences) externe à ceux étu­diés (on sait alors que la branche reliant ce groupe aux autres peut être consi­dé­rée comme la racine) ou on peut consi­dé­rer que toutes les lignées ont évo­lué de la même manière en même temps et se dire que la racine est le point de l'arbre équi­dis­tant de toutes les feuilles. À par­tir de là, vous pour­rez alors choi­sir la visua­li­sa­tion qui cor­res­pon­dra le mieux à votre étude (phy­lo­gramme ou cla­do­gramme de plu­sieurs sortes pos­sibles).

  • L'extraction de sous-groupes : par­fois, on peut être ame­né à visua­li­ser des arbres gigan­tesques. Il peut être inté­res­sant alors de les décou­per astu­cieu­se­ment en plu­sieurs par­ties. Ain­si, vous pour­rez peut-être même aller jusqu'à ré-affi­ner vos ali­gne­ments en relan­çant ceux-ci uni­que­ment avec les séquences prises en consi­dé­ra­tion et vous pour­rez éga­le­ment affi­ner votre arbre à par­tir de vos nou­veaux ali­gne­ments.

J'espère que je ne vous ai pas per­du au fil de ce billet qui je l'espère vous aura per­mis de com­prendre les arbres phy­lo­gé­niques du début à la fin. Il est évident que je n'ai pas pu tout trai­ter d'un coup, mais ne vous en faites pas : je revien­drai 🙂



Pour continuer la lecture :


Commentaires

30 réponses à “Les arbres phylogénétiques : construction et interprétation”

  1. Avatar de Hocine Ziam
    Hocine Ziam

    Excellent résu­mé, cela ma per­mis d'avoir une idée claire alors qu'avant je ne dis­tin­gué plus entre ces tests sta­tis­tiques. J'aurais aimé lire un petit com­men­taires sur la signi­fi­ca­tion des valeurs boots­trap, valeur maxi­mum de vrai­sem­blance. Je trouve beau­coup d'auteurs qui uti­lise dans leurs inter­pré­ta­tions ces valeurs alors qu'ils uti­lisent des arbres de dis­tance géné­tique ou des Neigh­bor-joi­ning.

    Je vous prie de four­nir des éclair­cis­se­ment sur ces dans la mesure du pos­sible.

  2. Mer­ci Hocine pour votre com­men­taire.
    Je pen­sais avoir été assez clair pour ce qui est du boots­trap. La tech­nique en elle même est très bien expli­quée sur le lien que j'ai pro­po­sé dans le para­graphe. Je n'ai pas vou­lu répé­té la défi­ni­tion qui me sem­blait dif­fi­ci­le­ment amé­lio­rable. Cepen­dant si vous dési­rez que je vous explique celle-ci par rap­port à un cas concret que vous avez à dis­po­si­tion, j'en serai ravi.
    Le boots­trap est très uti­li­sé car très fiable.
    Pour ce qui est du maxi­mum de vrai­sem­blance, comme je l'ai dit dans l'article : tout dépend de ce que vous recher­cher à mon­trer.
    Par contre, je pense que vous vous trom­pez (ou alors je ne com­prend pas ce que vous dites) : il n'est pas pos­sible d'additionner une méthode dite de Maxi­mum de Vrai­sem­blance (ML) avec une méthode dite de Neigh­bor-Joi­ning (NJ).
    Enfin… oui, dans l'absolu c'est fai­sable mais ça n'aurait aucun sens.
    Com­pre­nez bien qu'ici on parle d'une méthode de carac­tère (ML) et d'une méthode de dis­tance (NJ). Ces deux méthodes ne sont pas uti­li­sées pour chercher/​trouver les mêmes choses.
    J'espère vous avoir éclair­ci dans votre ques­tion­ne­ment. N'hésitez pas à aller plus loin dans un autre com­men­taire si ce n'est pas le cas.
    Au plai­sir de vous lire !

  3. Avatar de Hocine Ziam
    Hocine Ziam

    Mer­ci Yoann pour le com­men­taire. Après avoir lu les infor­ma­tions du site, je com­prend bien que chaque méthode uti­lise des cri­tères dif­fé­rents, donc l'interprétation est fonc­tion des don­nées. Alors j'ai un pro­blème de lan­gage pour l'interprétation. J'ai construit un arbre basé sur ; je vais l'écrire en anglais si vous n'avez pas d'inconvénients ; the ave­rage dis­tance using the per­cen­tage of iden­ti­té. ce qui n' a rien a voire avec le NJ. Dans ce cas pré­cis est ce que je peux par­lé des valeurs boots­trap (rela­tive aux dif­fé­rentes valeurs de la dis­tance géné­tique qui s'affiche sur l'arbre)entre les dif­fé­rents groupe. De plus, je ne sais pas est ce que vous êtes prêt à m'aider pour l'interprétation de cette arbre. Si oui je vous prie de me faire par­ve­nir votre mail afin je vous fasse part de docu­ment.
    Cor­dia­le­ment.

  4. Votre com­men­taire est assez flou. J'ai l'impression que beau­coup de notions se mélangent mal­heu­reu­se­ment.
    Vous pou­vez m'envoyer un mail à admin[at]bioinfo-fr.net avec votre arbre et la manière dont vous l'avez construit.
    J'essayerai alors de vous aider à com­prendre et inter­pré­ter ce der­nier.

  5. Avatar de Koffié

    Mer­ci pour le cours. Je sou­shaite savoir quel est l'astuce pour iden­ti­fier les sous-groupes dans un arbre phy­lo­gé­né­tique.

    1. Avatar de Yoann M.

      Bon­jour Kof­fié,

      l'identification de sous-groupes dans un arbre est propre à chaque arbre et à chaque élé­ment étu­dié. Je ne peux donc pas vous four­nir de for­mule miracle : ça n'existe pas.
      Bon cou­rage dans vos inter­pré­ta­tions et mer­ci pour votre com­men­taire.

      1. Avatar de Vincent Lefort
        Vincent Lefort

        A défaut d'avoir une méthode pour iden­ti­fier des groupes, vous pou­vez essayer d'identifier des phy­lo­types grâce au logi­ciel du même nom :
        http://​www​.phy​lo​type​.org
        Atten­tion, en plus de l'arbre au for­mat Newick, il fau­dra vous munir d'un fichier conte­nant des anno­ta­tions rela­tives aux taxa étu­diés.

        1. Avatar de Yoann M.

          Bon­jour Vincent et mer­ci pour ton com­men­taire.
          Je ne connais­sais pas ton logi­ciel, mais il me semble qu'il est très récent à en jugé la date de la publi­ca­tion.
          Il fau­drait don­ner un exemple de ce que tu appelles "anno­ta­tions rela­tives aux taxa étu­diés". Rien que sur le site on ne voit pas qu'il faut ça. Un petit tuto­riel manque selon moi.
          Je serai heu­reux d'essayer phy­lo­type pour des études futures quand tout sera bien expli­qué 🙂

  6. Slt ! Je suis vrai­ment très satis­fait de par­cou­rir ce site et voir ton brillant résu­mé en ce qui concerne l’interprétation des arbres phy­lo­gé­né­tiques qui m'a tou­jours coû­té de la qui­nine.
    Au fait je suis de la L3 Bio(option Eco­lo­gie) mais dans une de nos matières(cladistique)je suis confron­té à ces inter­pré­ta­tions.
    Ton résu­mé m'a beau­coup servi,je vou­drai si le temps te per­met de m'approfondir un peu sur l'analyse du boostrap(non pas sur ce qu'on observe au niveau de l'arbre mais au niveau phy­lo­gé­né­tique).
    Grand mer­ci à toi.

    1. Avatar de Yoann M.

      Bon­jour Dial­lo,
      Mer­ci pour votre com­men­taire, je suis heu­reux de savoir que cet article ait pu vous éclai­rer.
      Pour l'analyse du boots­trap, je pense en faire un article. Donc dès que j'ai un peu de temps je m'y met­trai. Mer­ci pour ton sui­vi !

  7. Avatar de Cédric
    Cédric

    Bon­jour,
    Mer­ci pour ce tuto qui per­met d'avoir une vision plus nette de ce qui se fait en construc­tion d'arbre phy­lo. J'ai cepen­dant besoin d'un éclair­cis­se­ment concer­nant RaXML. Est ce qu'il fait du maxi­mum de par­ci­mo­nie ? et com­ment le faire en GUI ?
    Mer­ci d'avance.
    Cédric

    1. Avatar de Yoann M.
      Yoann M.

      Bon­jour Cédric et mer­ci pour votre com­men­taire.
      De mémoire RaXML per­met bien de faire du maxi­mum de par­ci­mo­nie mais je ne peux pas vous aider pour la ver­sion GUI : je n'utilise que la ligne de com­mande :/​
      Si vous ne trou­vez pas votre bon­heur avec le GUI voi­ci le manuel de la ver­sion "pour bar­bu" : http://sco.h‑its.org/exelixis/oldPage/RAxML-Manual.7.0.4.pdf
      Bonne conti­nua­tion à vous !

  8. Bon­jour,
    je vou­drais d'abord vous remer­cier pour votre résu­mé, y'a plein de trucs que j'ai com­pris avec vos expli­ca­tions, mer­ci beau­coup.
    j'ai une ques­tion, quand je fais un boots­trap est ce que c'est sen­sé que l'arbre soit enra­ci­né ou pas ? en fait avec NJ j'arrive à enra­cin­né l'arbre mais avc boots­trap les espèce s'enmelent (j'ai comme même un 100% sur la branche du out­group)
    mer­ci

    1. Avatar de Yoann M.

      Bon­jour lyn­da,
      Très heu­reux que ça puisse t’aider. Pour ce qui est de ta ques­tion n’oublie pas une chose : la méthode de boots­trap n’aide pas à dire si la méthode uti­li­sée est bonne, elle te sert juste a appuyer ta démons­tra­tion à l’aide de sta­tis­tiques.
      De plus, la dif­fé­rence entre un arbre non enra­ci­né et un enra­ci­né est que le pre­mier (non-enra­ci­né) sera une repré­sen­ta­tion intem­po­relle des rela­tions phy­lo­gé­né­tiques, tan­dis que le second (enra­ci­né) te spé­ci­fie­ra où se situe l’ancêtre com­mun de tes espèces étu­diées.
      J’espère que cela t’aidera un peu plus ! Bonne conti­nua­tion à toi !

      1. mer­ci pour votre reponse si rapide, en fait j'ai réa­li­sé d'abord l'arbre avec NJ puis j'ai fais le boots­trap pour voir jus­te­ment la fia­bi­li­té des branches obte­nus (c'est bien ça n'est-ce pas?) , mais appa­rem­ment j'ai pas le même résultats.Alors que avec NJ j'ai mon out­group et les autres espèces qui ont le même ancêtre (puisque c'est le role même du out group) avc le boots­trap ce der­nier s'imbrique au sein même des espèces. voi­là je sais pas si c'est un peu clair. mer­ci

        1. Avatar de Yoann M.

          Si ton out­group s'infiltre dans arbre après un boots­trap c'est que la plu­part des cas tes­tés ont don­né ça comme réponse. Après cela peut te per­mettre de voir une erreur dans ton/​tes hypothèse(s) de départ. Es-tu sure que ton out­group est très éloi­gné des autres tes­tés ? Les séquences ne sont-elles pas trop diver­gentes entre elles ?
          Cela peut venir de plein de chose… Et c'est dif­fi­cile de te répondre comme ça sans savoir exac­te­ment ce que tu cherches à faire et quel jeu de don­née tu as :/​

          1. ok!!!merci beau­coup, j'y vois deja un peu plus clair. bonne conti­nua­tion 🙂

  9. je vous remer­cie pour ce résu­mé qui m'a per­mis de mieux com­prendre pas mal de notions sur la construc­tion d'arbres phy­lo­gé­né­tiques et leur ana­lyses ain­si que les méthodes uti­li­sées.
    cepen­dant la ques­tion que je me pose est la sui­vante : que doit-on faire après l'obtention de l'arbre (avec appli­ca­tion du bootstap,avec uti­li­sa­tion d'une méthode d'inférence adé­quate à l'objectif de l'étude bien­sur)? est ce que on peut pas­ser a l'interprétation direc­te­ment ou y a til d'autre test a appli­quer pour nos résul­tats ?
    mer­ci bq pour ce que vous faites.

    1. Avatar de Yoann M.

      Bon­jour aylan et mer­ci pour votre com­men­taire.
      En effet vous pou­vez vous arre­ter là afin de pas­ser à l'interprétation. Ou alors vous pou­vez peau­fi­ner votre étude en ciblant un ou plu­sieurs clus­ters qui appa­rai­traient grâce à votre arbre et ain­si répé­ter l'opération sur celui-ci/­ceux-ci afin d'avoir quel­que­chose de peut etre plus pré­cis ciblé uni­que­ment sur les indi­vi­dus pré­sents dans le/​les cluster(s) d'intérêts.
      Un très bon début d'année à vous !

  10. Avatar de DIMARTINO

    Bon­jour !
    Je ren­contre un gros pro­blème quant aux valeurs de boots­trap. Grâce à vous j'ai très bien com­pris ce qu'elles signi­fiaient mais il m'est IMPOSSIBLE après de longues recherches, d'obtenir ces valeurs sur mon arbre. J'ai récu­pé­ré mon for­mat Newick et j'ai visua­li­sé mon arbre sur Tree­Dyn ! Mer­ci par avance de votre pré­cieuse aide.
    Cor­dia­le­ment.

  11. mer­ci pour cette magni­fique cla­ri­fi­ca­tion, est ce que c'est pos­sible d'avoir le livre "Concepts et méthodes en phy­lo­gé­nie molé­cu­laire

  12. Bon­jour, je vais réa­li­ser mon oral de fin de stage du Mas­ter 2 de Bio­in­for­ma­tique de Bor­deaux demain, j'ai réa­li­sé un stage sur la phy­lo­gé­nie et mis au point un pipe­line de construc­tion d'arbre phy­lo­gé­né­tique auto­ma­ti­sé basé sur des ali­gne­ments de pro­téines conser­vées, nom­mé Mol­li­ge­ny.

    Je vou­lais juste vous dire que je me suis beau­coup ser­vi de vos résu­més sur l'alignement mul­tiple et les arbres phy­lo­gé­né­tiques etc… et je viens de voir que vous êtiez dans le même mas­ter que moi ! Donc je vous remer­cie beau­coup pour tout, et vous sou­haite bonne conti­nua­tion 🙂

    1. Bon­jour Paul,

      En effet je suis un ex-bor­de­lais ! Très heu­reux que cet article t'aie ser­vi mal­gré ses quelques années main­te­nant. Je l'avais rédi­gé dans ce but 🙂
      N'hésite pas à en par­ler lors de ton oral demain, ça te vau­dra sur­ement quelques points en plus 😀 (Marie, si tu nous lis : il est très bien ce petit ! 🙂 )

      Et si tu es par­tant pour un nou­vel article qui rafrai­chi­rait peut-être un peu celui-là, n'hésite sur­tout pas !

      1. Mer­ci beau­coup c'est vrai­ment très utile et j'ai beau­coup appris à tra­vers vos expli­ca­tions et je vou­drai avoir votre adresse mail si c'est pos­sible
        mer­ci d'avance

        1. Avatar de Yoann M.

          Bon­jour Dieye,

          Heu­reux de voir que cet article sert tou­jours ! Vous pou­vez com­mu­ni­quer avec moi via le fil de com­men­taires ici sans pro­blème 🙂

  13. Milles Mer­ci !
    C'est vrai­ment bien utile et clai­re­ment expli­qué.

    Très bonne jour­née & bonne conti­nua­tion 🙂

  14. Bon­jour, petite ques­tion ! Quels sont les avan­tages de fair un arbre phy­lo­gé­ne­tique en uti­li­sant des don­nées molé­cu­laires plu­tôt que des carac­tères déri­vés ?

    1. Avatar de Yoann M.
      Yoann M.

      Bon­jour, si je com­prends bien votre ques­tion je dirais que c'est deux choses dif­fé­rentes : géno­mique ("don­nées molé­cu­laires") contre phé­no­ty­pique ("carac­tères déri­vés").

  15. Avatar de ARTHUR KLADOUMBE
    ARTHUR KLADOUMBE

    Bon­jour ! Je suis vrai­ment ému et d'avis de lire cet article. Celà m'a vrai­ment per­mis d'aborder les ques­tions en bio­in­for­ma­tique. Ma ques­tion est de savoir:1/ quelle sont les matrices de trans­ver­sion et les matrices de dot-plot uti­li­sées pen­dant les ali­gne­ment par paire ? 2/​ quels sont les dif­fé­rents modèles d'évolution que l'on peut uti­li­ser pour la construc­tion d'un arbre phy­lo­gé­né­tique ?

  16. Avatar de chafouin

    Bon­jour ! Votre article est réel­le­ment cap­ti­vant et j'aurais bien vou­lu des réponses à mes ques­tions !

    Je vou­lais savoir quels méthodes uti­li­sés dans le cas ou :

    j'ai l'ARN 16S d'une bac­té­rie et je veux la com­pa­rer à d'autres bac­té­ries plus ou moins proche
    si elles sont du meme genre ou espèce , j'utilise du coup le maxi­mum de vrai­sem­blance ?
    et une fois l'arbre éla­bo­ré , j'ai du mal à com­prendre et à expli­quer pour­quoi tel ou intel ce retrouve à cette endroit la !

    pour­riez vous m'aidez ?

    je sais que ca n'as pas de lien direct avec votre article mais je tente tout de meme !

Laisser un commentaire