woensdag 15 juli 2009

Sorteren op weinig en sorteren op meer gegevens

Eerder in dit blog zijn de Italiaanse Europese Wilde Katten gesorteerd op een deel van hun mitochondriaal DNA. Dat is toen gedaan voor een stukje van 50 basen uit het gerapporteerde DNA. Er bleken toen op grond van de base-volgorde van dat stukje mitochondriaal DNA twee groepjes katten te zijn: een groepje met 11 katten en een groepje met 5 katten. Het groepje met 5 katten bevat oa kat Fsi72, en het groepje met 11 katten bevat oa kat Fsi99.


figuur 1: klik voor vergroting
Fylogenetische boom van 16 katten op 50 basen mitochondriaal DNA;


Een fylogenetisch boom is een hypothese. Deze hypothese kunnen we testen door meer DNA basen in de sortering op te nemen. Het artikel van Randi et al. (2001) rapporteerde 688 basen.

Welke fylogenetische boom krijgen we als we 688 basen gebruiken?

Deze:

figuur 2: klik voor vergroting
Fylogenetische boom van 16 katten op 688 basen mitochondriaal DNA;


Nu worden de katten gesorteerd in 3 groepjes. Er zijn nu 10 katten in een groep met kat Fsi99, met duidelijker ondersortering. De overige 6 katten staan dichter bij elkaar dan bij elk van de katten in de groep met Fsi99 – bedenk dat we alleen via de lijnen mogen lopen. Deze zes katten vormen nu een groep van 4, met Fsi72, en en een groep van twee katten, Fsi22 en Fsi90. Katten Fsi22 en Fsi90 hoorden ook al bij elkaar in de sortering op 50 basepaar, maar dat was niet zo goed te zien (omdat de labels over elkaar staan).

Kat Fsi84 is verhuisd: van de groep met Fsi99 naar de groep met Fsi72. Dat kan gebeuren als er meer gegevens zijn.

Sorteren op meer base paar geeft al met al een beter gedifferentieerde sortering, en een beter inzicht welke kat het meest (in zijn mt-DNA) op welke andere kat lijkt.

-------------------------

E. Randi, M. Pierpaoli, M. Beaumont, B. Ragni & A. Sforzi, 2001. Genetic identification of wild and domestic cats (Felis silvestris) and their hybrids using Bayesian methods. Molecular Biology and Evolution 18:1679-1693.

5 opmerkingen:

  1. De volgende vraag lijkt me dan: hoe verandert deze sortering als je meer katten toevoegt? Krijg je dan meer groepen? Of blijkt er juist een geleidelijke overgang te bestaan tussen twee groepen?

    BeantwoordenVerwijderen
  2. Dit blog heeft enige vertraging opgelopen door de activiteiten die te vinden zijn op
    http://landelijke-beta-actie.blogspot.com/

    BeantwoordenVerwijderen
  3. @DEEN
    Dit zijn alle katten en alle basepaar uit deze studie. Dat betekent dat niet met zekerheid te zeggen valt wat er gebeurt als er nog mee Italiaanse Wilde Katten toegevoegd worden - het kan zijn dat er 3 groepen blijken te zijn, maar het kan zijn dat er verdere differentiatie optreedt, en dat de lange lijnstukken opgebroken worden.
    Aan het kaartje in de publicatie van Randi et al te zien komen de groepen niet overeen met verschillende gebieden.

    BeantwoordenVerwijderen
  4. Ik heb altijd gedacht dat fylogenetische bomen gebouwd worden met methoden om fylogenetische relaties (bijv tussen soorten) te onrafelen, en dat die methoden niet per definitie geschikt zijn om tokogenetische relaties (tussen individuen) te ontdekken en af te beelden.
    Het lijkt met dat in dit stuk gen-bomen en soort-bomen door elkaar worden gehaald.
    Ik ga nu eerst Randi et al maar eens lezen om te kijken wat ze precies hebben gedaan...

    BeantwoordenVerwijderen
  5. Randi et al doen niet hetzelfde als ik hier doe in het blog. Wat er nog het meest op lijkt is hun figuur 3.
    Randi et al geven de DNA volgorden van haplotypen - dwz ze geven de website op waar de haplotypen die ze gevonden hebben staan - , en ik maak er met ClustalW op verschillende manieren clusters van. Tot nu toe heb ik alleen Felis silvestris silvestris haplotypen gebruikt, dus het gaat om variatie binnen een soort, zelfs binnen een ondersoort. Het gaat me hier erom wat er gebeurt als je meer gegevens teovoegt, bij gebruik van een bot algemeen clusterings programma.

    BeantwoordenVerwijderen