Key points are not available for this paper at this time.
Le problème de la découverte de l'arbre le plus parcimonieux est défini en termes d'un ensemble de séquences disposées linéairement. Des simplifications sont introduites pour réduire le total de travail, y compris l'élimination des positions non informatives et la reconnaissance des positions équivalentes. La procédure peut être appliquée à tout ensemble de séquences, y compris les acides aminés. Il est cependant démontré que le fait de ne pas convertir de telles séquences, par le biais du code génétique, en séquences nucléotidiques est très coûteux en termes d'informations pertinentes. La parcimonie est présentée comme une procédure qui minimise les discordances (substitutions parallèles et/ou arrière). Une procédure (un diagramme de discordance) est fournie, permettant de reconnaître quand deux caractères (positions nucléotidiques) nécessiteront l'acceptation de telles discordances et combien, au moins, seront inévitables. La soustraction de ces discordances inévitables d'une matrice de discordances potentielles conduit à une matrice de discordances évitables qui donnent généralement au moins deux paires de taxons les plus étroitement liés de manière parcimonieuse (c'est-à-dire, zéro discordance évitable) et peuvent donc être remplacées par une forme ancestrale déterminée par le processus de parcimonie. Le processus de parcimonie est également expliqué. Le processus peut être répété jusqu'à ce que l'arbre soit terminé. Une méthode de détermination d'une borne inférieure au nombre de substitutions requises est donnée et fournit une borne inférieure beaucoup plus élevée que les estimations précédentes. Une estimation rapide de la borne supérieure est également fournie. Une approche alternative, utilisant un réseau Prim-Kruskal (arbre couvrant minimal) sur les distances de discordance évitables, est donnée avec une procédure pour interpréter de tels réseaux en termes de phylogénie qui semble plus naturelle que les dendrogrammes généralement employés dans l'interprétation des diagrammes à liaison unique. La réduction d'un arbre strictement bifurquant à un réseau Prim-Kruskal est appelée compression et son inverse est appelé décompression, l'arbre original étant récupéré après un cycle complet des deux processus. Il existe une correspondance unique et bijective entre tout arbre phylogénétique et sa forme de réseau compressée. La forme compressée peut servir de base à une représentation linéaire sans ambiguïté d'un arbre qui est plus compacte que celle de toute autre méthode de représentation connue.
Walter M. Fitch (mar.) a étudié cette question.