maandag 16 oktober 2017

Genduplicaties bij de vleet

Twee mensen weten meer dan één mens en twee genen doen meer dan één gen: misschien dan. Verdubbeling van een gen – dat is wat genduplicatie betekent – is de voornaamste bron van nieuwe genen. En nieuwe genen zijn de motor van de evolutie, met natuurlijke selectie als brandstof. Met nieuwe genen kun je  goed 'complexer' worden – niet dat ik helemaal zeker weet wat 'complexiteit' is, maar het geeft een idee.  Nieuwe genen zijn een bron van 'innovatie' – al kan innovatie ook wel zonder nieuwe genen.
Maar ja, genduplicatie dus. Hoe kom je aan gedupliceerde genen (gemakkelijk) en wat krijg je met gedupliceerde genen (heel veel mogelijkheden)?
               
Hoe nieuwe genen ontstaan
DNA wordt gecopieerd als cellen delen. Er zijn twee soorten celdeling, mitose maakt nieuwe diploïede lichaamscellen en meiose maakt haploïde geslachtscellen uit diploïde lichaamscellen. Ik hoop dat dat onderwezen wordt op de middelbare school, maar als dat niet zo is, het staat ook op wikipedia. Bij de meiose verdubbelt eerst het DNA, zodat elk chromosoom uit twee strengen – chromatiden – bestaat die verbonden worden door het centromeer. De overeenkomstige chromosomen (bv chromosoom 3 afkomstig van de vader en chromosoom 3 afkomstig van de moeder) gaan netjes naast elkaar liggen en wisselen DNA uit. Dit heet crossing over en gebeurt  in chiasmata.
Dat uitwisselen werkt via breuken in chromatiden die daarna weer aan elkaar gezet worden. Meestal gaat dat precies maar lang niet altijd. Als het niet precies gaat kan er veel of weinig verandering in het DNA optreden. Crossing-over midden in DNA met bv de volgorde ..ACACACACACACAC.. geeft gemakkelijk een AC meer of minder. Ook verder zit er nogal wat herhaling in DNA – wat wil je ook met maar 4 basen – en het gevolg is dat er nogal wat fouten optreden, en ook na controleren blijven zitten.
               
Hoeveel nieuwe genen?
Hoe vaak komen extra stukjes DNA voor? Die vraag is min of meer te beantwoorden nu DNA sequencen niet meer al te duur is. Elke geslachtscel sequencen gaat nog wat ver, maar variatie in DNA sequentie binnen een soort valt te doen. Dus, op zoek naar genetische variatie in hoeveelheid DNA binnen een soort of populatie. Genetische variatie in hoeveelheid DNA heet Copy Number Variation (CNV), en duplicatie van genen is maar één van de mogelijkheden voor Copy Number Variation (CNV).
De misschien meest bestudeerde soort (na mens) is Drosophila melanogaster. De standaardset Global Diversity Lines (GDL) bestaat uit 84 lijnen uit afkomstig uit vijf gemonsterde populaties:  Beijing, China (15 lijnen); Ithaca, US (19 lijnen); Netherlands (19 lijnen); Tasmania (18 lijenen); and Zimbabwe (13 lijnen). Elke lijn is ingeteeld en voor zo ver mogelijk homozygoot. Dat geeft een bruikbare verzameling voor genetische variatie binnen populaties tussen lijnen, en tussen populaties. Dat is dan duidelijk wel genetische variatie die een eerste test van levensvatbaarheid doorstaan heeft.


Sequencen van alle 84 lijnen geeft aan wat voor verschillen en overeenkomsten er zijn (Grenier et al, 2015). Bij deze lijnen is nagetrokken hoe vaak verschillen in copy number van een stukje DNA aanwezig is ten opzichte van het referentiegenoom van Drosophila melanogaster (Cardoso-Moreira et al, 2016). Er werd gekeken naar CNV van stukken DNA tussen 25 basepaar en 25000 basepaar lang. Er werden 2221 duplicaties, 56562 deleties en 3850 inserties van DNA van die maat gevonden. Copy Number Variation komt relatief weinig voor in DNA dat voor eiwit codeert en in DNA dat met de regulatie van eiwitgenen te maken heeft. Duplicatie van DNA voor delen van genen komt weinig voor, maar duplicatie van volledige genen blijkt vaker voor te komen dan in eerste instantie op grond van hun DNA lengte was verwacht.


 


Figuur 2 A: wat voor type DNA in tweevoud of meer voorkomt in hoeveel lijnen binnen een populatie. Alle duplicaties per categorie samen 100%. Bijvoorbeeld,duplicatie van  DNA tussen genen (intergenic) vormt  20% van eenmalig voorkomende duplicaties; duplicatie van volledige genen vormt  >30%  van duplicaties die in met hoge frequentie in populaties voorkomen. B: Gen duplicaties komen niet in elke populatie met dezelfde frequentie voor.  






In totaal zijn er over de 84 lijnen 491 genduplicaties gevonden. Het is duidelijk dat genduplicaties binnen een populatie polymorf zijn: dat is, het gen kan in enkelvoud of in tweevoud in een lijn gevonden worden, maar niet in 100% van de lijnen van een populatie in twee voud. Dat betekent dat de genduplicaties in de populaties waaruit de lijnen afkomstig zijn onderdeel uitmaken van de genetische variatie.

De eerste conclusie is dat duplicaties van genen verre van zeldzaam is.
               
Is er selectie op de gedupliceerde genen?
Dezelfde studie naar het voorkomen van genduplicatie keek ook naar sporen van selectie in het DNA van deze 84 lijnen (Cardoso-Moreira et al, 2016). De aanwezigheid van selectie laat sporen na in ht DNA: het allel dat door selectie in frequentie toeneemt sleept zijn omgeving in het DNA met zich mee. Het gevolg daarvan is dat met het allel ook de omgeving die specifiek is voor dat allel in frequentie toeneemt. En dat betekent weer dat de DNA omgeving van dat allel dat in frequentie is toegenomen relatief homogeen is.
Om te beginnen moet je dus kijken bij duplicaties die in hoge frequentie zijn in een populatie, en voor die duplicatie zoeken naar eenvormigheid in de omgeving. Die relatieve eenvormigheid is te zien bij sommige duplicaties. De duplicatie van het gen Prosbeta5R2 heeft minder genetische variatie in zijn omgeving dan de niet gedupliceerde variant, bijvoorbeeld.  

Figuur 3 Relatief weinig genetische variatie in de omgeving van een duplicatie die een hoge frequentie in zijn populatie heeft


Er waren acht genduplicaties geschikt voor deze benadering. Vijf daarvan lieten aanwijzingen voor selectie ten gunste van de duplicatie zien.  Dat houdt al met al in dat  omstreeks de helft van de genduplicaties door selectie op hoge frequentie is gekomen, en ongeveer de helft door toeval. In beide gevallen betekent het dat wat meer DNA aanmaken voor de vlieg geen enkel punt is. Een beetje DNA meer maken leidt niet tot selectie tegen de duplicatie vanwege te veel uitgaven voor de bouwstoffen voor DNA.

               
Wat nieuwe genen doen:            Meer van hetzelfde
Nog steeds dezelfde studie naar het voorkomen van genduplicatie keek ook naar het effect van de duplicatie van genen (Cardoso-Moreira et al, 2016). Een gen moet tot expressive komen wil het meedoen, en het eerste daarvan is het aanmaken van RNA uit het DNA van het gen. Er is gekeken naar genexpressie gemeten als RNA van bij volwassen mannetjes. Dat werkte voor 288 van de 491 gedupliceerde genen. Van die 288 gedupliceerde genen hadden er 121 een hogere expressie, meer RNA, in de lijnen met de genduplicatie, en 7 gedupliceerde genen hadden lagere expressie (dus 160 zonder verschil in genwerking). Bedenk wel dat de hoeveelheid gevonden RNA per gen in een volwassen mannetje niet direct het niveau van het genproduct hoeft weer te geven: de totale hoeveelheid RNA van een gen kan ook nog geregeld worden.

 

Figuur 4. Voorbeeld van toename in genexpressie met aantal copieën voor het gen Prosbeta5R2



               
Wat nieuwe genen doen:            Beetje differentiatie
De studie van Cardoso-Moreira et al, 2016 zocht naar patronen in DNA, en vond dat genduplicaties niet zeldzaam zijn, soms toenemen als gevolg van selectie en soms tot hogere hoeveelheid genproduct leiden. Zo'n studie kijkt niet in detail naar elk gen. Voor meer inzicht in de gevolgen van genduplicatie is dan nodig voor een aantal genen nauwkeuriger te kijken hoe ze werken. (wordt vervolgd (promise!))
******************
Cardoso-Moreira et al, 2016. Evidence for the fixation of gene duplications by positive selection in Drosophila. Genome Research 26:787–798
Grenier et al, 2015. Global diversity lines: a fivecontinent reference panel of sequenced Drosophila melanogaster strains. G3 5: 593–603









3 opmerkingen:

  1. in verband met baten/kosten van genduplicatie: rapporteren ze het totaal aantal bp in de lijnen zodat je kunt zien wat de netto toename/afname van hun DNA is? NB als je het complete genoom op de base nauwkeurig kunt bepalen, moet je exact ween wat het aantal bp in het genoom is, toch?

    BeantwoordenVerwijderen
  2. De huidige telling voor het Drosophila melanogaster reference genoom is 143910902 bp. De laatste versie van het Drosophila melanogaster reference genoom wordt besproken in
    https://www.ncbi.nlm.nih.gov/pmc/articles/PMC4352887/ (Open Access)
    Tabel 1 daar geeft de details

    Toevoegen van 1% meer DNA zou zijn toevoegen van 1.5 miljoen basepaar. Een gen van 3000 basepaar dupliceren geeft 2 tienduizendste vermeerdering aan DNA. Een genduplicatie maakt niet uit voor de energie gebruikt voor DNA aanmaken.

    BeantwoordenVerwijderen
  3. Bedankt. Inderdaad. en zo kan het gebeuren dat een genoom met verwaarloosbare kleine stapjes in de loop van de tijd steeds groter en groter wordt.
    Als je consequent redeneert zullen ook kleine deleties verwaarloosbaar zijn in dat opzicht (verwaarloosbare energiewinst opleveren, celdelingsnelheid). Maar deleties zullen een risico hebben op een functieverlies en dat zal een duplicatie nooit hebben, neem ik aan. Dus: theoretisch zullen meer duplicaties dan deleties zich ophopen?

    BeantwoordenVerwijderen