woensdag 12 augustus 2009

sorteren en sorteren ten op zichte van

Op 25 mei keken we naar een klein stukje mitochondriaal DNA, van 50 basen lang, in Italiaanse Europese Wilde Katten. Op grond van vier katten hadden we de hypothese opgesteld dat base A de oorspronkelijke base op positie 17 en op positie 39 (van de 50) was, terwijl base G de mutante versie was. Die hypothese werd verder onderbouwd door naar 15 katten te kijken. De conclusie was dat het soms mogelijk is de volgorde van mutaties te beredeneren door te sorteren en te vergelijken.

Bij het bekijken van 50 basen voor 15 katten bleken er meer verschillen in DNA volgorde te zijn. Wel hadden sommige katten dezelfde DNA volgorde – dat heet formeel, hetzelfde haplotype, voor deze 50 basen.

Om alle katten te scheiden en de volledige set haplotypen te onderscheiden gebruiken we meer gegevens, namelijk een sequentie van 688 basen uit mitochondriaal DNA. Het sorteren van de 16 Europese Wilde Katten uit Italie laat dan drie groepen haplotypen zien:





klik voor vergroting
Fylogenetische boom van 16 katten op 688 basen mitochondriaal DNA
;

De groepsindeling vertelt weinig over de volgorde waarin mutaties zullen zijn opgetreden.
Maar niet niets: binnen de groep Fsi84, Fsi71, Fsi72 en Fsi92 kunnen we bijvoorbeeld wel iets zeggen. We weten dat de verschillen gevonden worden op posities 77, 107, 125, 189, 391, en dat ze er als volgt uitzien:

FSI84 TTCTT
FSI72 CCTCT
FSI92 CTTTT
FSI71 CTTTC
alle andere Fsi TTTTT


Fsi84 heeft een privémutatie T naar C op positie 125. Fsi72, Fsi92 en Fsi71 hebben de mutatie van T naar C op positie 77 gezamenlijk; dit is de enige gezamenlijke mutatie voor deze drie mitochondriale sequenties. Daarna trekken Fsi92 en Fsi71 gezamenlijk op, tegenover Fsi72. Dit houdt in dat Fsi72 twee privémutaties heeft, T naar C op positie 107 en T naar C op positie 189. Fsi71 heeft nog de mutatie van T naar C op positie 391. Samen wordt dat de fylogenetische boom als in figuur 1 voor deze vier sequenties.

Het is duidelijk hoe het gegeven dat alle andere Fsi sequenties op alle vijf posities T hebben gebruikt wordt: dit is wat verteld dat Fsi72, Fsi92 en Fsi71 een groep vormen.ten opzichte van Fsi84.

Wat waren we nu aan het doen? We bekeken 4 sequenties, Fsi84, Fsi72, Fsi71 en Fsi92 ten opzichte van alle andere Fsi sequenties. Dat “ten opzichte van” beslist de volgorde in de fylogenetische boom binnen deze groep van 4 sequenties. Dat “ten opzichte van” beslist wat we zullen aanhouden als meest waarschijnlijke hypothese voor de volgorde waarin de mutaties zijn opgetreden.

Dit suggereert een methode om een fylogenetische boom voor de haplotypen van al deze 16 Europese Wilde Katten uit Italie te maken: zoek een mitochondriaal DNA sequentie waarmee de mitochondriaal DNA sequentie van de Europese Wilde Kat te vergelijken valt, en sorteer ten opzichte van die DNA sequentie.

Dat is mogelijk: er zijn nog andere Wilde Katten dan de Europese Wilde Kat, bijvoorbeeld de Noord-Afrikaanse Wilde Kat. In Italie komen beide ondersoorten van de Wilde Kat voor: Europese Wilde Katten Felis silvestris silvestris op het vasteland van Italie en Noord-Afrikaanse Wilde Katten Felis silvestris libyca op Sardinie. We kunnen dan de 16 haplotypen van de Europese Wilde Kat F. s. silvestris sorteren ten opzichte van een of meer sequenties van de Noord-Afrikaanse Wilde Kat F. s. libyca. Het artikel van Randi et al (2001) geeft de basevolgorde in hetzelfde stukje mitochondriaal DNA van 688 basen voor 16 F. s. silvestris haplotypen en 7 F. s. libyca haplotypen.

De 16 F. s. silvestris haplotypen waarin we geinteresseerd zijn heten de binnengroep, en F. s. libyca heet de buitengroep. Het gaat erom de binnengroep te sorteren: dat de buitengroep er buiten staat weten we, want die is daarvoor gekozen. De buitengroep wordt zo gekozen dat er mee te werken valt, dus iets dat “vrij dicht bij” de binnegroep staat. Het heeft weinig zin de binnengroep van Europese Wilde Katten te sorteren tegen bv rijst, als datzelfde stukje mitochondriaal DNA al in rijst te vinden zou zijn.

We krijgen een fylogenetische boom van 16 F. s. silvestris haplotypen, gesorteerd ten opzichte van de buitengroep F. s. libyca. We hebben al de beeldspraak van een boom, en dan volgt natuurlijk de beeldspraak van de worteling van de boom. Een buitengroep wortelt de fylogenetische boom.

Eerste sortering:
16 F. s. silvestris haplotypen, een ongewortelde boom


Tweede sortering:
16 F. s. silvestris haplotypen en 1 F. s. libyca haplotype
Eerste plot van de tweede sortering: als ongewortelde boom


Tweede plot van de tweede sortering: als gewortelde boom.



Deze manier van plotten heeft de voorkeur als er een buitengroep gebruikt wordt.

Derde sortering:
16 F. s. silvestris haplotypen en 7 F. s. libyca haplotypen.


Eerste plot van de derde sortering: als ongewortelde boom




Tweede plot van de derde sortering: als gewortelde boom.




Deze manier van plotten heeft de voorkeur als er een buitengroep gebruikt wordt.

We hadden ook nog de ongewortelde boom met 7 F. s. libyca haplotypen


De buitengroep in een geworteld plot staat bovenaan of onderaan in de fylogenetische boom.

Het gaat dus niet om veranderingen tussen F. s. silvestris en F. s. lybica: we gaan ervanuit dat die twee verschillen, omdat we dat weten op grond van de morfologie. Het gaat erom uit de sortering een hypothese te krijgen over de volgorde van de veranderingen binnen F. s. silvestris.

De eerste splitsing binnen F. s. silvestris is tussen de groep met de zes katten Fsi71, Fsi72, Fsi84, Fsi90, Fsi92, Fsi122 en de overige katten F. s. silvestris. Deze van zes groep katten heeft base C op positie 36 (van 688) terwijl de overige F. s. silvestris katten én de F. s. libyca katten base T hebben. Dit is de enige positie waar deze 6 haplotypen met z’n zessen afwijken van de andere F. s. silvestris. De hypothese is dat base C hier de mutante base is. Er zijn ook nog 3 posities waarbij vijf van deze groep van zes afwijken van de overige F. s. silvestris, maar niet op dezelfde manier. In totaal definieren deze mutaties de groep van zes haplotypen.

Zo kunnen we doorgaan. De groep met Fsi77 en Fsi91 heeft als enige F. s. silvestris de base C in plaats van T op posities 202 en 681: de hypothese is dat C de mutante base is, en dat het gezamenlijke voorouder mitochondriaal DNA van Fsi77 en Fsi91 base C had. Fsi77 en Fsi91 verschillen op positie 307 (waar Fsi77 base G in plaats van base A heeft, als enige voor zowel F. s. silvestris als F. s. libyca).

************
E. Randi, M. Pierpaoli, M. Beaumont, B. Ragni & A. Sforzi, 2001. Genetic identification of wild and domestic cats (Felis silvestris) and their hybrids using Bayesian methods. Molecular Biology and Evolution 18:1679-1693.

Geen opmerkingen:

Een reactie plaatsen