maandag 19 april 2010

Zuinigheid (met vlijt …)

Als we naar de morfologische kenmerken binnen de katten kijken, zien we dat er bijna geen een kenmerk is dat netjes groepen splitst. Kijk bijvoorbeeld bij de splitsing van de Grote Katten en de Kleine Katten. Er zijn drie kenmerken die alle zes de soorten Grote Katten hebben – maar die kenmerken komen her en der ook in de Kleine Katten voor. Er zijn drie kenmerken die niet in de Kleine Katten maar wel in de Grote Katten voorkomen. Twee van die drie kenmerken komen maar in vijf van de zes Grote Katten voor, niet dezelfde vijf Grote Katten. Van het derde kenmerk dat alleen in Grote Katten en niet in Kleine Katten voorkomt is niet bekend wat het is voor het Sneeuwluipaard. Dat is nog daarmee nog het beste kenmerk. Waarom weten we dit niet?
Het kenmerk is iets met de bobbels op de achterste valse kies van het melkgebit, in de onderkaak. Jonkies sneeuwluipaard zijn zelden voorradig in de dierentuin, en dan moeten ze ook nog hun mond open willen doen voor de tandarts

Het is dus binnen de familie Katten niet mogelijk om een indeling te maken die steeds een volgend kenmerk neemt, en dan de beesten splitst in een groep met en een groep zonder dat kenmerk. Maar we willen toch binnen de katten in groepen indelen. Wat is dan de volgende beste mogelijkheid voor indelen?

Zuinigheid bijvoorbeeld. Dat waren we in feite toch al aan het doen, al legden we er niet de nadruk op.
Een indeling die indeelt op: heeft kenmerk wel, heeft kenmerk niet, voor een opeenvolgende set kenmerken, maakt een indeling met de minst mogelijke verandering in kenmerktoestand. Twee groepen – wel-kenmerk, niet-kenmerk – is zuiniger dan vier groepen, twee met wel-kenmerk en twee met niet-kenmerk. Bij vier groepen – twee wel-kenmerk en twee niet-kenmerk – moeten we twee keer een overgang maken van niet-kenmerk naar wel-kenmerk; bij twee groepen – één wel-kenmerk, één niet-kenmerk – is er maar een keer een overgang van niet-kenmerk naar wel-kenmerk. Dat is zuiniger. Indelen op gezamenlijk afgeleid kenmerk geeft dus ook de zuinigste indeling die mogelijk is.

Dat idee van zuinigheid bij indelen houden we vast. We maken de indeling die het zuinigst is in aantal overgangen. Hierbij een voorbeeld van het idee.


Figuur blz 61 C.zimmer, TheTangled Bank


Dit principe van zuinigheid bij indelen heet parsimony. In de plaatjes die ik uit artikelen haal wordt het vaak gebruikt voor indelen. Het is niet de enige of modernste manier van indelen, maar een heel gangbare.

Het voordeel van zuinigheid bij indelen is dat het voor alle kenmerken gebruikt kan worden. Voor DNA sequenties, voor aminozuursequenties, voor kenmerken in levende organismen, voor kenmerken in fossielen – altijd te gebruiken.

Stel bijvoorbeeld dat we 4 vogelsoorten willen indelen, twee aan twee (waarom twee aan twee? voor het voorbeeld.). Dan zijn er drie mogelijkheden voor de indeling – drie fylogenetische hypothesen.


Campbell & Reece figure 25-14

We gaan kijken of we onderscheid kunnen maken tussen de fylogenetische hypothesen, op grond van DNA gegevens.

We hebben een sequentie van het DNA waarin op 7 plaatsen variatie tussen de soorten optreedt:


Campbell & Reece, figure 25-15a

Op plaats 1 verschilt soort I van de soorten II, III, en IV: base A en niet base G. De zuinigste indeling is dan die waarin er een verandering is opgetreden op plaats 1 na de laatste soortssplitsing tussen soort 1 en zijn naaste verwante soort: of dat nu soort II, soort III of soort IV is. Er is één verandering is nodig om het patroon op plaats 1 te krijgen.

Het kan zijn dat in werkelijkheid soort II, én soort III én soort IV veranderd zijn: dat weten we niet. Dat vraagt 2 of 3 veranderingen: het is zuiniger om het op 1 verandering te houden.

Eén verandering, op plaats 1 naar soort I, is het zuinigst. Maar plaats 1 vertelt ons niets over onze fylogenetische hypothesen. Plaats 2 ook niet, en de plaatsen 3 en 4 ook niet.

Bij plaats 5 komt er schot in de zaak. Hier hebben de soorten I en II G, en de soorten III en IV A. Het is het zuinigst om te veronderstellen dat de verandering opgetreden is in de gemeenschappelijke voorouder van soort I en II (als het om een mutatie van A naar G gaat) of in de gemeenschappelijke voorouder van soort III en IV (als het om een mutatie van G naar A gaat). Dan gaat het om één verandering, die dan op de linker fylogenetische hypothese duidt. De middelste en rechter fylogenetische hypothese hebben hier twee veranderingen nodig.

Plaats 6 doet hetzelfde als plaats 5: weer een stem voor de linker fylogenetische hypothese.

Plaats 7 spreekt de plaatsen 5 en 6 tegen: Hier hebben de soorten I en III T, en de soorten II en IV G. Het is het zuinigst om te veronderstellen dat de verandering opgetreden is in de gemeenschappelijke voorouder van soort I en III (als het om een mutatie van G naar T gaat) of in de gemeenschappelijke voorouder van soort II en IV (als het om een mutatie van Y naar G gaat). Dan gaat het om één verandering, die dan op de middelste fylogenetische hypothese duidt. De rechter en linker hebben hier twee veranderingen nodig.

Hoeveel veranderingen hebben we nodig in totaal, voor elk van de drie fylogenetische hypothesen?
Linker fylogenetische hypothese: DNA plaatsen 1, 2, 3, 4 brengen elk één verandering in; plaatsen 5 en 6 brengen elk één verandering in; plaats 7 heeft twee veranderingen nodig: totaal 8 veranderingen.
Middelste fylogenetische hypothese: DNA plaatsen 1, 2, 3, 4 brengen elk één verandering in; plaatsen 5 en 6 brengen elk twee veranderingen in; plaats 7 heeft één verandering nodig: totaal 9 veranderingen.
Rechter fylogenetische hypothese: DNA plaatsen 1, 2, 3, 4 brengen elk één verandering in; plaatsen 5 en 6 brengen elk twee veranderingen in; ook plaats 7 heeft hier twee veranderingen nodig: totaal 10 veranderingen.

De zuinigste fylogenetische hypothese is daarmee de linker: soort I indelen bij soort II, soort III bij soort IV.

Is het niet verschrikkelijk dat kenmerken elkaar tegenspreken?
Ligt er een beetje aan welke kenmerken het zijn. Hier gaat het om DNA, en omdat er maar 4 DNA basen zijn, is het nogal voor de hand liggend dat er door mutatie een zelfde toestand uitkomt, of dat er dezelfde mutaties optreden: als T één keer muteert is er 1/3 kans om op G uit te komen, en na lange tijd en veel mutaties is er ¼ kans om weer bij T terug te komen. Voor DNA is het daarmee te verwachten dat er tegenspraak optreedt als je naar verschillende base paren kijkt. Daarom wordt aan de zuinigste oplossing de voorkeur gegeven.

Bij katten is het ook niet vreselijk als pluimpjes aan de oren of spitse oorpuntjes wat her en der over de kleine katten voorkomen. Vooruit, zoiets mag onafhankelijk ontstaan. Sommige dingen mogen niet. Een moleculaire indeling op één gen die de Zuid-Amerikaanse groep van zes katten, de groep van de ocelot, uit elkaar gooit maakt het nodig te veronderstellen dat de fusie van chromosomen 2 en 3 op precies dezelfde manier twee keer onafhankelijk van elkaar is opgetreden. Hier gaat zuinigheid op chromosoomgebied voor: de DNA sequentie is dan waarschijnlijk te kort om goed in te kunnen delen.

***********************
N.A. Campbell & J.B. Reece, 2002. Biology, 6th Edition, Benjamin Cummings; Prentice-Hall. (2002 is de editie waar de figuren uit zijn; intussen is editie 8 uit)

C. Zimmer, 2009. The Tangled Bank: an introduction to evolution. Roberts and Company Publishers.

Geen opmerkingen:

Een reactie plaatsen