Neem de volgende stamboom, van moeders en dochters: overopoe met twee dochters, elk weer twee dochters en zo door.

Veronderstel dat we op iets als mtDNA, dus iets dat van moeders op dochters rechtstreeks en haploid overerft, sorteren.
De acht dochters kunnen we bijvoorbeeld als volgt karakterisen:
>do111 htccccbbbaaaaaaaaaaaaaaaaaaaaddfge
>do112 htccccbbaabaaaaaaaaaaaaaaaaaaddfge
>do121 htccccbaaaaabbaaaaaaaaaaaaaaaddfge
>do122 htccccbaaaaabaabaaaaaaaaaaaaaddfge
>do211 htccccaaaaaaaaaaaaaaaaaaaabbbddfge
>do212 htccccaaaaaaaaaaaaaaaaaabaabbddfge
>do221 htccccaaaaaaaaaaaaaaaabbaaaabddfge
>do222 htccccaaaaaaaaaaaaaabaabaaaabddfge
De karakterising van de dochters lijkt niet erg op DNA, maar dat geeft niet. Een programma als ClustalW waarmee ik de eenvoudige fylogenetische boompjes maak geeft daar niet om.
De fylogenetische boom van de 8 dochters ziet er volgens ClustalW als volgt uit:
We zien dat dochter do111 en dochter do112 meer verwant zijn met elkaar dan met dochters do121 en do122, en dat dochters do111, do112, do 121 en do 122 onderling meer verwant zijn dan met de andere vier dochters.
Op grond van hun ‘sequentie’ zoals boven gegeven zien we dat dochter 111 op plaats 9 een b heeft – waar iedereen verder een a heeft staan. Dochter 112 heeft op plaats 11 een b, waar indereen verder een a heeft. We zouden dan kunnen veronderstellen dat de moeder, ma 11, de volgende ‘sequentie heeft, met op plaats 7 en 8 een b en verder niet:
>ma11 htccccbbaaaaaaaaaaaaaaaaaaaaaddfge
Op dezelfde manier kunnen we reconstreren:
>overopoe htccccaaaaaaaaaaaaaaaaaaaaaaaddfge
>opoe1 htccccbaaaaaaaaaaaaaaaaaaaaaaddfge
>opoe2 htccccaaaaaaaaaaaaaaaaaaaaaabddfge
>ma11 htccccbbaaaaaaaaaaaaaaaaaaaaaddfge
>ma12 htccccbaaaaabaaaaaaaaaaaaaaaaddfge
>ma21 htccccaaaaaaaaaaaaaaaaaaaaabbddfge
>ma22 htccccaaaaaaaaaaaaaaaaabaaaabddfge
Nu hebben we een ‘sequentie’ voor iedereen in de stamboom, en kunnen we een fylogenetische boom maken voor alle 15 individuen. Die fylogenetische boom ziet er als volgt uit:
We hebben alle 15 individuen gebruikt. Alle 15 individuen komen dan op het einde van een lijntje te staan, als gelijkwaardig. We zien dat er twee grote groepen zijn, behorend bij opoe 1 en opoe 2. Ook zien we dat overopoe en opoe 1 samen in een vorkje staan. Ja, zo werkt dat: overopoe is meer verwant met haar dochters opoe 1 en opoe 2 dan met haar kleindochters of achterkleindochters. Alleen, het programma moet kiezen of het overopoe bij opoe 1 of opoe 2 zet.
Waarom staan opoe 1 en opoe 2, de zusters, niet naast elkaar? Omdat opoe 1 in één letter van de ‘sequentie’ van overopoe verschilt, en opoe 2 ook in één letter van de ‘sequentie’ van overopoe verschilt, maar in een andere letter. Er zijn twee verschillen tussen opoe 1 en opoe 2.
Hoe zit dat met do212, do211, ma 21 en opoe 2?
>do211 htccccaaaaaaaaaaaaaaaaaaaabbbddfge
>do212 htccccaaaaaaaaaaaaaaaaaabaabbddfge
>ma21 htccccaaaaaaaaaaaaaaaaaaaaabbddfge
>opoe2 htccccaaaaaaaaaaaaaaaaaaaaaabddfge
Opoe2 en ma21 zijn hier meer verwant dan ieder van de twee is met do212 of do111: dat is omdat ze op plaats 25 en 27 a hebben (waar de dochters van ma21 verschillen). Waarom zijn ma21, do211 en do 212 niet dichter bij elkar gezet tegenover opoe2, op grond van de gedeelde b op plaats 28? Omdat de rest van de familie a heeft op plaats 28.
(Waaom het programma ClustalW besloot om do211 als dichter bij ma21 en opoe2 te sorteren dan do212 weet ik niet: dat zijn van die nare grapjes. )
In ieder geval: een stamboom omzetten in een fylogenetische boom kan narigheid opleveren in dit soort sorteringen op grond van DNA. Vergelijkbare groepen gebruiken, hier alleen de dochters, is een netter idee.
We kunnen wel afstamming zien in een fylogenetische boom: als een groep binnen een andere groep terechtkomt met sorteren.
Als er veel stammen van Drosophila simulans gebruikt worden zien we dat Drosophila sechellia en Drosophila mauritiana binnen de D. simulans sorteren. Dan zien we dat D. sechellia en D. mauritiana van D. simulans afstammen. Maar niet van een bepaalde D. simulans stam!
Bij Buteo galagapoensis zagen we dat Galapagos buizerd mtDNA binnen Swainson’s buizerd mtDNA sorteerde. Dan stamt B. galapagoensis van B. swainsoni af. Maar niet van een bepaalde B. swainsoni familie!
Invoer voor een fylogenetische boom komt altijd op het einde van een lijntje te staan. De overeenkomst tussen de invoer wordt in de fylogenetische boom weergegeven. In een fylogenetische boom kun je nooit besluiten dat twee groepen (families, soorten, stammen) die beide op het einde van een lijn staan van elkaar afstammen. Dus ook deze:

Hier staat dat de vogels en Archaeopteryx een gezamenlijke afstamming in de dinosauriers hebben. Uit een dergelijk diagram is nooit te besluiten dat de huidige vogels van Archaeopteryx afstammen. Hoe die gezamenlijke voorouder van Archaeopteryx en de huidige vogels er dan uitgezien zou hebben? Nou ja, iets als Archaeopteryx.