|
Atlantis and Paleogeography |
|||||||
Européernas DNA
från en geografs perspektiv:
40.000 år
av omblandning
av
Ulf Erlingsson
En rapport från ett privat forskningsprojekt. Syftet var att få fram "constraints" för den förhistoriska utvecklingen, baserat på arvsanlag, för att senare kombinera dessa resultat med arkeologi, mytologi, och paleogeografi. Huvudslutsatsen var att det ännu fanns för lite DNA-data för några säkra slutsatser, men vissa spekulationer kunde göras. De flesta tillgängliga data var från före årtusendeskiftet.
Detta är text nummer 2. Se även text nummer 1, "Global Change".
© Ulf Erlingsson, 2003, 2004, 2005
Foton och illustrationer avförfattaren om ej annat anges.
Alla rättigheter förbehålles.
Innehållsförteckning
Studiet av arvsanlagen
Den moderna människan
Släktträd
Datering av släktträdet
Populationsstatistik
Grundaranalys
Kartläggning
Släktträd
Tematiska kartor
Europas dominerande haplogrupper
Släktträd
Tematiska kartor
Åldersbestämning och ursprungsanalys
Korrelationsanalyser/p>
Varifrån kommer haplogrupp V?
Varifrån kommer då samerna?
Diskussion: Förhistoriska folkvandringar
Ut ur Afrika
Högistid
Nordeuropa återkoloniseras
Mellanösterngener till Europa
Europas stora öar
Fler pusselbitar
Arvsanlag som kitt mellan myt och historia
Husdjur
Appendix: Geostatistik för analys av DNA-data
Rumslig korrelation
Ett simulerat exempel
Slutsats
Europas historia består av många pusselbitar, och kan studeras med hjälp av olika discipliner. Denna text tar sin utgångspunkt i analyser av DNA (arvsanlagen) från både Y-kromosomen och mitokondrierna (mtDNA). Dessa gör det möjligt att se hur människor är släkt på fädernet respektive mödernet, i tidsperspektiv av tusentals till tiotusentals år.
Denna text utgör ett försök att återskapa en översiktlig historia, inte bara över hur människan anlände till Europa, utan också över folkens förflyttningar inom kontinenten och i dess närområde (Mellanöstern, västra Sibirien och Centralasien). Tiden som behandlas är under och efter istiden. Även om det endast är i undantagsfall som DNA-resultaten kan bekräfta historiska folkvandringar, så kan de — och det är ju betydligt intressantare, om man tänker efter — belysa myter och sägner. Därmed kan man visa att dessa berättelser är historiska, vilket flyttar gränsen för förhistorien bakåt i tiden. Det visar sig att myterna ofta inträffat längre tillbaka i tiden än vad de själva vill göra gällande. Att så sker kanske är en generell regel i all muntlig tradition.
I denna text läggs grunden för ett återskapande av Europas historia från istid till nutid. De myter som förklaras är dock bara ett urval, och de som är enklast att leda i bevis. Andra myter kan bara förstås med ett tvärvetenskapligt angreppssätt. Historien består nämligen av många parallella trådar. Det är naturhistorien, folkens arvsanlags historia, språkens historia, den politiska historien, krigshistorien, den materiella kulturens historia, folkvandringarna, naturkatastroferna, religionerna... De är sammanvävda; för att se helheten måste man känna delarna, och för att förstå delarna måste man känna helheten.
En sak som jag vill poängtera är dock att människans intellektuella förmåga säkert inte förändrats nämnvärt inom den tidsrymd detta handlar om. Det som får äldre tider att se mera primitiva ut i det arkeologiska arkivet är till inte ringa del att föremål försvinner med tiden. Dels försvinner de därför att de multnar och rostar och vittrar bort. Dels blir det mer och mer osannolikt att hitta ett föremål ju äldre det är, av geologiska skäl. Från de äldsta tiderna är det bara sten som återstår idag. Och så guld, men det är ju värdefullt så det har säkert återanvänts redan.
Vi kallar den tiden Stenåldern. De gamla grekerna kallade den Guldåldern. Objektivt sett är nog det senare bättre. Guldtillgången per capita var nog högre då, så guldet spelade nog en större roll i samhället än under de följande tiderna. Med undantag för vår egen tid; guld är ju en förutsättning för mycket av den avancerade elektroniken, som kontaktmetall. Under Guldåldern kände de till guld, silver, koppar och bly. Man kan göra mycket med de metallerna.
Vad jag vill komma till är att människans historia kan vara längre än vad vi i allmänhet anar. När man kombinerar fakta från olika discipliner bör man därför tillåta ganska mycket flexibilitet i kronologin. Detta sagt, så går vi väl över till människans DNA äntligt.
Den senaste källan till kunskap om människans historia kommer från människans gener, våra arvsanlag. De spelar samma roll för det levande, som källkoden i ett datorprogram; de gör inte jobbet, men de skapar de proteiner som gör jobbet. De flesta arvsanlag finns i kromosomer som är dubblerade, så att en kommer från modern och en från fadern. Dessutom kombineras generna om. Men det finns två uppsättningar arvsanlag som inte kombineras om: Y-kromosomen (som enbart män har), och mitokondrie-DNA (som ärvs enbart från modern). Med dessas hjälp kan man göra ett släktträd för varje kvinna, och två för varje man (hans anfader och anmoder).
Mitokondrie-DNA (mtDNA) är en liten ring på endast 16571 baspar som finns inne i mitokondrierna, alltså de organeller inne i cellerna där själva energiomsättningen sker. De bildades, får man väl anta, som följd av en symbios mellan en encellig organism och en bakterie för mer än en miljard år sedan. Mitokondrierna kommer helt från äggcellen, och därför ärvs mitokondrie-DNA på mödernet, från mor till barn. År 2000 blev kartläggningen av hela sekvensen klar. [1]
Även om dessa bitar DNA går i arv från släktled till släktled utan omkombinering, så förändras de ändå så sakteliga på grund av mutationer. En del mutationer påverkar förstås individens överlevnadsförmåga. Därför verkar det naturliga urvalet på dem, och deras frekvens ökas eller minskas i enlighet med det. Andra mutationer är däremot neutrala ur överlevnadssynpunkt. I mtDNA-molekylen används framför allt två hypervariabla regioner i den så kallade D-slingan, HVS1 och HVS2 (andra skrivsätt: HV1, HVR1, HVS-I). Mutationer i dessa beräknas inträffa mellan 1 gång per 77 till 1 gång per 1136 generationer (medel: 1 per 235 generationer). Det kan också uttryckas som en mutation per baspar per 3,1 miljon år. Eftersom det finns många hundra baspar, och många människor i en population, så blir det många mutationer även på ganska kort tid. Siffrorna är framtagna just genom att titta på ett antal människor på Island vars släktskap är känd, i flera generationer, och i det materialet fanns 3 mutationer av 705 möjliga generationsskiften (Sigurdardottir et al. 2000)[2].
En enskild människa tillhör en viss utvecklingslinje när det gäller mtDNA (och, om det är en man, även Y-kromosomen). Om en grupp av människor har samma sekvens i det avsnitt som studerades kallas det en haplotyp. En grupp av haplotyper som är närliggande och förmodas ha utvecklats från samma ursprung kallas en haplogrupp. De inordnas i sin tur i överhaplogrupper, och så vidare.
Det är ju inte säkert att två individer med samma haplotyp är på samma linje, eftersom det dels kan förekomma mutationer också i de avsnitt som inte studerades, och dels kan samma mutation ha uppkommit flera gånger. Sannolikheten för det senare är minimal om bara slumpen spelar in, men om mutationen har ett överlevnadsvärde så ökar sannolikheten betydligt.
Det finns olika typer av mutationer, med olika frekvens. Dessutom är mutationsfrekvensen enligt forskarrapporter olika på olika platser i arvsanlaget, och det förefaller som om vissa mutationer kan göra närliggande positioner instabila. När man börjar fördjupa sig i människans släktskap är det lätt att glömma bort, att arvsanlaget inte finns till för att kunna studera släktskap, utan för att koda de proteiner som behövs för individens grundläggande livsfunktioner. Det betyder, att segment där man observerar låg variation kanske inte nödvändigtvis har lägre mutationsfrekvens, utan de kanske istället är mera kritiska för individens överlevnadsförmåga.
Med andra ord, ett grundantagande som man ofta gör när man studerar släktskap med hjälp av mutationer, är att de mutationer man tittar på är neutrala i förhållande till det naturliga urvalet. Men ny forskning visar att en mutation som kan vara neutral under vissa förhållanden, kan ha ett överlevnadsvärde under andra förhållanden, till exempel ett annat klimat. Två folkgrupper som hade samma fördelning av haplotyper från början, men som har vistats i olika klimat under en längre tid, kan därför nu ha olika frekvens av haplotyperna.
Med "den moderna människan" avser jag inte den post-industriella1900-talsmänniskan, utan Homo sapiens sapiens, Cro Magnon, vår art och ras helt enkelt. Som det nu ser ut, har den moderna människan utvecklats i Afrika, från en anmoder som levde för ett par hundra tusen år sedan. Denna anatomiskt moderna människa (kallad Cro Magnon) kom till Europa under den senaste istiden, och ersatte då den tidigare människan, av Neandertaltyp. Fortfarande pågår det dock forskning om det var två raser som blandades med varandra, eller om de uppträdde som två arter i förhållande till varandra. Det är nämligen inte nödvändigt att två grupper är så genetiskt olika att de inte kan fortplanta sig för att de ska låta bli — de kan också låta bli därför att de inte vill, därför att de inte är attraherade av varandra.
Från Afrika spreds den moderna människan till Mellanöstern. Därifrån tog hon sig vidare dels till Asien, dels till Europa. Senare spreds en grupp från Centralasien till både Amerika och Europa, och blev dominerande överallt utom i Afrika och Sydostasien. Till det senare området kom människan tidigt, och ättlingarna till de första invandrarna finns kvar i isolerade delar av övärlden. Minst två invandringsvågor har nått den Australiska kontinenten och övärlden norr därom före den europeiska invasionen, och förmodligen kom den moderna människan till Australien innan hon kom till Europa. Över havet, väl att märka. Vare sig det nu var i en människogjord farkost, eller flytande på drivved som förts till sjöss av en tyfon.
Med hjälp av mtDNA-analys har man kunnat visa att det finns ett stort hopp mellan de europeiska neandertalarna, och de samtida Cro Magnon-människorna. De senare ligger däremot helt inom den nutida variationen — två individer från södra Italien hade båda haplotyper som idag återfinns i trakten, och som är möjliga anmödrar till de flesta nutida européer (noll respektive en mutation från Cambridge Reference Sequence, CRS, den vanligaste i Europa). I Afrika finns det idag haplotyper som ligger mer än ett dussin mutationer från CRS, men europeiska neandertalare däremot ligger ungefär två dussin mutationer från CRS.
Som exempel på denna
forskning kan nämnas Comas et al.
(1997)[3],
som jämförde mtDNA hos 9 europeiska och västasiatiska populationer och kom fram
till slutsatsen att det var en gradvis och utdragen process att ersätta
neandertalarna med moderna människor. De sista neandertalarna dog förmodligen
ut då istiden gick mot sitt allra kallaste, för mellan 20 och 30 tusen år
sedan, medan de första moderna människorna kom till Europa för si så där 50
tusen år sedan. Arkeologiska vittnesbörd placerar den första invandringen några
tiotusentals år längre tillbaka i tiden. Det är ju inte säkert att några av
deras mtDNA eller Y-kromosomlinjer överlevt, så uppgiften om mutationens ålder
ger bara en minimiålder — och dessutom med stor osäkerhet.
Nu skall man komma ihåg, att även om inte en enda neandertal-mtDNA-linje eller dito Y-kromosom överlevt till nutid, så kunde ändå vissa andra gener ha tagits upp av den moderna människan, ifall de två grupperna hade blandats. Emellertid finns det inga skelettfynd som tyder på en sådan "felande länk". Visst finns det en modern folktro som vill göra gällande att det fortfarande finns "snömän" (se till exempel www.bigfootencounters.com), men det finns inga handfasta bevis i form av kranier eller DNA-prov. Personligen tror jag därför att yetin har mera släktskap med jättar än med neandertalare. Som Hans Blix påpekade beträffande ABC-stridsmedel i Irak: Det är svårt att bevisa att det som inte existerar inte finns. Bättre då att basera sin verklighetsuppfattning på någorlunda objektiv kunskap om sådant som kan studeras, och acceptera att det finns olika typer av vetande. Bland det mest objektiva är människans DNA. Hur man tolkar data är mera subjektivt, så det skjuter jag upp till slutet av texten.
Det finns en hel del man kan använda DNA-data till, kring det centrala temat att titta på släktskap. Men det finns också fallgropar, och det finns all anledning att komma ihåg den gamla sanningen att det finns tre grader av lögn: Lögn, förbannad lögn, och statistik. Annorlunda uttryckt, man måste hålla huvudet kallt och ha i åtanke vad data egentligen representerar, och vilka uttalade eller underförstådda antaganden man gjort. Som den vetenskapliga litteraturen de senaste 5 till 7 åren visar, så går det att komma fram till diametralt motsatta slutsatser för människans spridning, när man använder dessa data.
Man kan inte nog påpeka vikten av att som forskare (vare sig man är amatör eller yrkesforskare) göra sig själv medveten om sina egna undermedvetna antaganden. Oftast är det där, på det undermedvetna planet, som de grövsta felen uppstår. (Egentligen borde en formell logisk analys vara en del av all vetenskaplig slutledning, men det är väl att kräva för mycket av inledande studier i ett nytt ämnesområde.)
Det mest grundläggande som man måste göra klart för sig är emellertid, att det finns olika typer av kunskap och kunskapssökande. Ofta söker man det allmänna från det specifika. Det är då statistiken kommer in. Men det finns en annan sorts kunskap, som kräver att man behåller det specifika i fokus.
Låt mig visa med ett exempel. Människornas historia i Europa är som ett pussel. Genetikerna har försökt bringa ordning i oredan genom att söka efter Principal Components,de "viktigaste komponenterna". Vad man då vill åstadkomma är att finna de bakomliggande faktorer som orsakat den komplicerade bilden — till exempel invandring från Mellanöstern. Det är alltså underförstått att det finns några få faktorer som orsakat den komplicerade bilden. Men jämför nu med ett pussel. Principal component analysis ger oss gradienten i färg från topp till botten, och från vänster till höger. Men placerar vi in pusselbitarna efter deras genomsnittliga färg i förhållande till dessa gradienter, så får vi en nonsensbild som inte föreställer någonting. Slutsatsen blir att man måste studera varje pusselbit för sig. Likadant är det med Europas historia. Orsaken är att vår kontinents historia inte domineras av några få faktorer, utan förefaller vara summan av en stor mängd ungefär lika viktiga händelser: Folkvandringar, härnadståg, etnisk rensning, slavhandel, kvinnorov...
Om man låter bli att försöka generalisera, så kan man konstatera att det går att få fram mycket information om släktskap med genernas hjälp. Mig veterligen är denna text den första gång någon tagit sig an att verkligen gå till botten med Europas DNA, och inte ge upp inför den synbart slumpvisa sammanblandningen av folken.
Resultaten uteblev inte. Den som är otålig att direkt komma till nyheterna kan hoppa till avsnittet "Hur nära släkt är egentligen samerna och skåningarna?", efter att ha ögnat igenom kartorna över de olika haplotyperna. De andra får här först en introduktion till studiet av arvsanlag, och en redogörelse för de olika haplogruppernas utbredning.
Koden i DNA består av en sekvens av fyra sorters heterocykliska kvävebaser. Det kan därför representeras av en rad bokstäver, initialerna för dessa fyra basers namn, på detta sätt: ACGGTCATAAG. För att minska datamängden presenterar man ofta bara de platser som är variabla, och anger deras läge i sekvensen med ett nummer. På första raden anges referenssekvensen (här nedan CRS, Cambridge Reference Sequence, referensen för mtDNA), och på följande rader de prov man analyserat. En punkt (.) anger att den stämde med referenssekvensen. Om den skiljde sig så sätter man ut basens initial. Resultatet blir som i tabellen i Figur 2-1 (positionen skrivs vertikalt; den första är alltså 16039):
1111111111
6666666666
0000000001
3566788990
9179912623
GACCCCTTTT CRS
.G........ Haplotyp
1
A......C.. Haplotyp
2
.......... Haplotyp
3
...T.C.... Haplotyp
4
...T...... Haplotyp
5
A......CG. Haplotyp
6
..G....... Haplotyp
7
....C..... Haplotyp
8
......T... Haplotyp
9
.........A Haplotyp
10
Figur 2-1. En hypotetisk analys av mtDNA och det resulterande släktträdet.
I detta påhittade exempel med 10 variabla platser, har 10 haplotyper identifierats. Haplotyp 3 är identisk med CRS. Haplotyperna 1, 5, samt 7 till 10 är direkta döttrar till 3. Haplotyperna 2 skiljer sig med två mutationer från CRS, och vi vet inte vilken av mutationerna (16039G->A eller 16092T->C) som kom först. Föregångaren till haplotyp 2 kan antingen finnas kvar men inte vara anträffad vid provtagningen, eller ha dött ut. Haplotyp 4 är en dotter till 5; och 6, slutligen, är en dotter till haplotyp 2.
En linje som stämmer med mutationen i typ 2 hänför vi till haplogrupp 2. Stämmer den dessutom med 6, så hänförs den till haplotyp 6. För att skilja samtliga i haplogrupp 2, från dem i haplogrupp 2 som inte tillhör haplotyp 6, kallar man de förra för 2, och de senare för 2* (med en asterisk efter). Eftersom det kan finnas flera haplotyper under 2 förutom 6, så är 2* potentiellt flerfylig[4], medan 2 och 6 är enfyliga. På samma sätt är 3* och 5* potentiellt flerfyliga (3* är de som tillhör 3 men inte någon av de identifierade underklanerna).
Observera att haplogrupp 3 i exemplet inte nödvändigtvis representerar den mest ursprungliga DNA-sekvensen. Vilken som helst av de identifierade typerna kan vara den mest ursprungliga — och även den icke identifierade typen mellan 2 och 3. För att få reda på vilken som är mest ursprunglig har man tillgripit två metoder: Att analysera DNA från nutida schimpanser, och att analysera DNA från skelett av utdöda människor av neandertaltyp. Det har visat sig att även om CRS är den i Europa vanligaste sekvensen, så är den långt ifrån den äldsta haplogruppen bland nutida människor.
Detta illustrerar principen, men i verkligheten finns det ofta tvetydighet om hur olika haplotyper är släkt. De släktträd som presenteras är därför de statistiskt mest sannolika. Det är viktigt att ha det i åtanke, att även om det mesta nog är rätt, så är det också troligt att det finns vissa fel — som kanske spelar stor roll för en specifik tolkning. Alltså, man får inte ta detta för en absolut sanning. Finns det starka motargument så måste man väga in dem.
Släktträdet i Figur 2-1 är i stort sett stjärnformat runt 3. När så är fallet kan man beräkna statistik för hur länge sedan det var som mutationen som ligger till grund för haplogrupp 3 inträffade. Haplogruppen som CRS hör hemma i kallas H, och mutationen som bildade H har daterats till ca 26000 år före nutid. Osäkerheten i dessa dateringar är dock stor. Dels finns en möjlighet till ett systematiskt fel, ifall man har beräknat mutationsfrekvensen fel. Dels finns en stor statistisk osäkerhet, eftersom formeln bygger på att man har hittat samtliga mutationer som har inträffat efter att H bildades. Därför finns naturligtvis en stor osäkerhet på grund av att det trots allt är så få personer som har provtagits. Allt detta gör att felmarginalen på dateringarna ofta är tiotals procent, och ibland 50% — speciellt om släktträdet inte är stjärnformat.
Vad man daterar är naturligtvis inte själva mutationen, utan tidpunkten från vilken den haplotypen började differentieras genom nya, överlevande mutationer. Observera att om några av dessa nya mutationer inte återfinns i populationen så blir dateringen fel, åldern blir för låg. Det betyder, att om befolkningen nästan dog ut, men sedan började öka i antal igen, så ger dateringen inte åldern på mutationen utan på denna flaskhals för populationen. Precis samma sak händer när en liten grupp människor isoleras och startar en ny population.
Om haplogruppen också återfinns i en annan folkgrupp, och har en högre ålder där, så kan man dra slutsatsen att det rör sig antingen om en flaskhals eller om en "grundareffekt". Endast genom att ta hjälp av andra discipliner kan man skilja mellan de två alternativen.
DNA-studier har visat att med stor sannolikhet uppstod den moderna människan i Afrika, och spreds ut över världen genom Mellanöstern för mellan 35 och 89 tusen år sedan. Därefter har dock kontakterna mellan Afrika söder om Sahara och resten av världen varit ganska svaga. Av den anledningen fokuseras detta kapitel på utvecklingen i Eurasien.
Den grundläggande analys man kan göra är att beräkna hur många procent av de provtagna individerna som har respektive haplotyp. Man behöver inte ens göra något släktträd för att göra den statistiken. Provtar man till exempel 100 norrmän och 100 svenskar så kan man se om norrmän och svenskar är samma population eller ej. Om de visar sig inte tillhöra samma population, så kan man emellertid inte direkt se hur nära eller långt ifrån varandra de ligger, om man inte har ett släktträd. Skillnaden kan ju vara på kvistnivå i släktträdet, men det kan lika gärna vara olika stammar, även om bara en mutation skiljer. Vidare, en haplogrupp som man identifierat baserat på en del av DNA-sekvensen kan i verkligheten vara flerfylig, alltså sammansatt av grenar som ligger långt från varandra på släktträdet. Även om de två populationerna förefaller vara lika så kan de ändå vara olika.
En mera filosofisk fråga är om det över huvud taget är meningsfullt att tala om populationer. DNA ärvs ju faktiskt på individnivå. Det är individerna som är mer eller mindre släkt, inte "populationerna". Enligt modernt synsätt är det generna själva som är utvecklingslärans subjekt, så att säga. Det är inte arternas kamp om överlevnad, utan genernas kamp om överlevnad. Vi är bara vandrande genbärare — ville man vara finurlig kunde man därför påstå att vi alla är "gengångare".
Populationerna är statistiska konstruktioner, och man kan tala om att de är "samma" med 95% sannolikhet, åtskiljda med 95% sannolikhet, eller vad som helst däremellan. Men individerna är ju aldrig "samma". Hur nära släkt måste individerna vara för att de ska räknas som "samma" i populationsstudien? Det är naturligtvis en bedömningsfråga, och det kan variera, från att de skall tillhöra samma haplogrupp till samma haplotyp.
Man kan också ange det genomsnittliga antalet mutationer som skiljer, men även det kan stöta på svårigheter. Om ett folk består av en blandning av två grenar som ligger långt ifrån varandra, så blir ju den inre olikheten stor. Skulle ett annat folk bestå av samma två grenar i blandning, så kommer skillnaden mellan folken att bli mindre än den inom folken. Detta är en av svårigheterna i Europa — ca 99% av variationen ligger inom folken.
Nästa steg är naturligtvis att försöka räkna ut hur och när de två populationerna fick de likheter de uppvisar. Det är det som kallas "founder analysis" på engelska, alltså "grundaranalys" ungefär, studiet av vilka som grundade en population.
I denna analys försöker man räkna ut hur stor andel av en viss population som har tillförts utifrån, varifrån den tillfördes, och när. Man behöver släktträd, dateringar och populationsstatistik som underlag. Men det räcker inte.
Vad man försöker göra är ju att, utifrån kunskaper om gensammansättningen i nutida populationer, för det första försöka uppskatta en forntida populations gensammansättning, och för det andra beräkna hur många procent av den populationen som tillfördes det som sedermera blev den nutida populationen. Denna analys har gett upphov till många motsägelsefulla resultat, när den har använts för att försöka uppskatta varifrån européerna härstammar. Det vanligaste felet är att man tagit gensammansättningen i en nutida förment ursprungspopulation som direkt representativ för den forntida populationen.
Som exempel på detta fel kan nämnas att anta att jordbrukarna som kom till Europa med den neolitiska revolutionen kom från Mellanöstern, och kan representeras av de nutida innevånarna i den regionen. Några har kommit fram till att de flesta av Europas människor härstammar från den invandringen, efter att ha jämfört med befolkningen i Levanten (Libanon, Syrien, Irak). Andra har kommit fram till att väldigt få kom i den vågen, efter jämförelse med beduinerna i den saudiska öknen. Bägge studierna gjorde felaktiga antaganden — den första genom att bortse från alla de invandringsvågor som gått från Europa till Levanten i historisk tid, den andra genom att jämföra med en nomadisk herdebefolkning som genetiskt sett inte är samma population som bönderna i regionen.
Att använda dagens befolkning i Mellanöstern som närmevärde för den forntida för mer än 8000 år sedan, utan någon diskussion om senare förändringar, är oklokt, och att det har kommit i tryck i en vetenskaplig tidskrift gör inte saken bättre. Det finns ju flera folk som har invandrat dit de senaste 5000 åren, en del med okänt ursprung, andra med känt europeiskt ursprung. Inte undra på att man kom fram till att Europas befolkning till nästan 80% överensstämmer med Mellanösterns. Problemet är alltså att forskarna valde att testa en modell för folkvandringar som inte är förenlig med historiska fakta. Därmed saknar analysen bevisvärde. Men detta får väl hänföras till kategorin ungdomssynder för forskningsgrenen ifråga.
Senare har ett fullgott forskningsarbete gjorts, och problemen i de tidiga studierna påvisats. Även flera av de forskare som själva gjort misstag har senare bidragit till att korrigera dem. Detta är ett utmärkt exempel på många saker, till exempel att forskningen går framåt, att forskare strävar efter perfektion, att man inte skall ta några resultat för de slutgiltiga, och att konkurrensen är så knivskarp att forskare kan frestas att ta genvägar för att snabbt få ut resultaten även om forskningen inte riktigt är mogen för det. Sens moral: Läs forskningsresultat kritiskt. Tänk! Är det rimligt? Gjordes de rätta antagandena? Artikelns början är speciellt viktig att lusläsa. Felen ligger kanske inte i de kemiska analyserna, utan i tillämpningen av resultaten inom fält där genetikerna kanske inte var specialister då de påbörjade arbetet?
I det följande skall vi återkomma till själva resultaten, och även diskutera hur frågeställningen bör formuleras.
När man läser vetenskapliga artiklar om "fylogeografi", alltså studiet av folkstammarnas geografi, baserat på genanalys, stöter man i huvudsak på kartor av tre typer: Sådana som visar var proverna tagits (med punkter eller polygoner för att ange en lokaliserad respektive utspridd provtagning), sådana som visar populationsstatistik med hjälp av cirkeldiagram ovanpå en karta, samt kartor med pilar som visar antagna folkvandringar. Endast någon enstaka studie har redovisat tematiska kartor över haplogruppernas fördelning.
Cirkeldiagrammen ger en hyfsad bild av respektive folks genfördelning, men det är inte möjligt att visuellt få en god överblick över en viss haplogrupps utbredning. För att få denna överblick presenteras här nedan tematiska kartor, med en karta för varje haplogrupp, för varje förgrening på släktträdet (i mån av tillgång till data). Kartorna redovisas sida vid sida på planscher (Plansch 2-1 och 2-2), och dessutom finns många av dem som figurer i texten i samband med att de diskuteras.
Själva DNA-data finns deponerade på databaser åtkomliga via Internet. Det som ofta inte finns är uppgifter om provets ursprung — för att få det måste man gå till källan, den artikel där undersökningen presenterades. Tyvärr varierar metadata (data om data) från undersökning till undersökning. Oftast anges landet, ibland folkgruppen (stammen), ibland språket, ibland vilken del av landet personen kom ifrån. Graden av geografisk ortbestämning varierar alltså kraftigt, men gemensamt är att ett antal prov tagits från samma population. Det beror givetvis på att man använder den statistiska metoden: Identifiera en population och gör ett urval från den.
I denna metod utgår man från en definition av populationer, för att sedan kontrollera om man hade rätt i att de var distinkta. "Som man frågar får man svar", heter det. Vore det inte möjligt, undrar vän av geografi, att istället förutsättningslöst söka efter populationerna bland rådata? Det vill säga koordinatsätta de personer som provtagits (inte alltför exakt, av hänsyn till den personliga integriteten), och sedan analysera data på olika sätt för att hitta gränser och andra strukturer i befolkningsfördelningen? Naturligtvis vore denna geostatistiska metod ett intressant alternativ, och man får väl hoppas att genetikerna tar hjälp av geostatistik och inte bara statistik i framtida studier.
På många platser är förstås den rumsliga fördelningen av folkgrupper uppenbar, och frågan är bara hur de olika grupperna är släkt, och med vilka. Men på andra platser, som i Skandinavien, är istället frågan i vilken mån det finns genetisk variation som motsvarar de skillnader i dialekt och andra karaktärer som landsbygdsbefolkningen själv ofta är medveten om. I Sverige, Norge, Danmark och Finland skulle ett finmaskigt nät av provtagning av folk ute i bygderna säkert vara den metod som skulle ha störst möjlighet att ge ett meningsfullt resultat. Som vi skall se i det följande kan det mycket väl finnas strukturer i data som dolts av den statistiska metoden, med dess definition av population som liktydigt med invånarna i Sverige. Om man istället jämförde härad för härad skulle resultatet säkerligen bli ett annat, men varför använda sådana indelningar över huvud taget? Varför inte använda de geografiska koordinaterna direkt, som i geostatistiken? Kanske en metod som Kriging kan vara lämplig?
Vid författandet av denna text var önskemålet att prova att använda Kriging på genetiska data, men dessvärre var det inte möjligt att få tag i användbara data. Den kartläggning som har gjorts har därför måst baseras på data per land eller region. I slutet av texten skisserar jag ändå hur Kriging skulle kunna användas i framtida studier.[5]
Vi ska först se på männens förhistoria, sedan på kvinnornas. Det beror inte på någon könsdiskriminering, utan på att Y-kromosomen muterar långsammare än mtDNA, och därför berättar om utvecklingen i ett längre tidsperspektiv än den senare. Och kanske med mindre ambivalens, eftersom det visar sig att mtDNA ofta har muterat flera gånger på samma plats i sekvensen, varför släktträdets utseende är mera osäkert. Dessutom måste man ha i åtanke att de två DNA-sekvenserna inte nödvändigtvis berättar samma historia — man kan inte utgå ifrån att männens och kvinnornas historia är sammanfallande, utan man måste leda i bevis att män och kvinnor har spritt sig på samma sätt ifall man vill använda det i ett senare skede av argumentationen. Utgångspunkten måste vara att de två typerna av DNA mycket väl kan ha spritt sig på delvis olika sätt och olika vägar, vid olika tidpunkter — inom vissa ramar och gränser.
Som exempel på detta kan nämnas att befolkningen i Belém i Brasilien idag till 59% är ättlingar till indiankvinnor, men samtidigt är de till mindre än 5% ättlingar till indianmän. Detta verkar för övrigt bekräfta studier som kommit fram till att kvinnor från låga socialgrupper, och män från höga socialgrupper, har störst chanser att föra släktet vidare. Liknande sociala och kulturella faktorer måste oundvikligen vägas in vid tolkningen av resultaten.
Ett släktträd för Y-kromosomen publicerades i februari 2002 av The Y Chromosome Consortium (2002)[6], hädanefter förkortat YCC. Förutom att ange ett enhetligt system jämförs det nya systemet med 7 tidigare publicerade, ofullständiga eller tvetydiga system. Grunddragen i släktträdet visas i Figur 2-2, och hela diagrammet i Figur 2-3.
Figur 2-2. Grunddragen, samt vissa för Europa speciellt relevanta grenar, i Y-kromosomens släktträd. Siffrorna anger beräknad tidpunkt för mutationen — eller rättare, för den begynnande expansionen av den följande haplogruppen. Utbredningen av de flesta av dessa haplogrupper i Eurasien redovisas i kartform på Plansch 2-1. Data är kompilerade från flera av de i texten citerade artiklarna.
Haplogrupp Y inkluderar samtliga kända linjer. F är en övergrupp som inkluderar flera stora haplogrupper, samt övergruppen K, som i sin tur inkluderar flera stora haplogrupper samt övergruppen P. Störst inom P är R, som dominerar västra Eurasien, samt Q3 som endast finns bland Amerikas indianer. N3 har hög frekvens hos samer (förr: lappar) och andra finsk-ugriska folk. R1b är dominerande i Västeuropa, och R1a1 i Östeuropa; den senare har associerats till indoeuropéernas utbredning och Ukrainas kurgan-kultur. I dominerar i Skandinavien och är även vanlig i Tyskland, medan E, G, H, J och L hör hemma i området Mellanöstern — Kaukasus — Indien. C hör till Sibirien, D till Tibet, M till Oceanien och O till Kina. Detta är naturligtvis en förenkling, men den ger en första grov kartbild.
Figur 2-3. Släktträd och nomenklatur för människans Y-kromosom enligt YCC (2002)6. Huvudhaplogrupperna anges med kapitäler. De röda koderna vid förgreningarna avser mutationer (t.ex. M9). De sju kolumnerna längst till höger visar hur systemet hänger ihop med tidigare system.
I en serie kartor över Eurasien (Plansch 2-1) återges frekvensen av respektive haplogrupp. Fördelen med denna kartläggningsmetod är att man snabbt får en överblick över en haplogrupps utbredning. Förutsättningen för att det skall vara meningsfullt är givetvis att varje karta endast återger en enda enfylig haplogrupp. Det vill säga, R är meningsfullt eftersom det visar "en släkt", medan en karta över R* visar en del av samma släkt, med vissa delar uteslutna — med andra ord, det är ett okänt antal släkter som samredovisas på en karta.
Med tanke på detta summerades haplogruppdata ihop, så att så många enfyliga haplogrupper som möjligt skapades. Dessa redovisades sedan på en karta över Eurasien. Framställningen av kartan består av två huvudsteg: Att skapa tabellen med haplogruppdata (denna tabell kallas attributdata i GIS-sammanhang — där GIS står för geografiska informationssystem), samt att avgränsa de geografiska områden (så kallade polygoner) som respektive post i attributdatatabellen skall kopplas till.
Visserligen kom den moderna människan från Afrika enligt så gott som samstämmiga forskningsresultat, men ändå redovisas inte Afrika på dessa kartor. Anledningen är dels praktisk (brist på data), dels att Afrika söder om Sahara och Eurasien är relativt isolerade från varandra, jämfört med Eurasien inbördes. Det är just folkrörelserna inom Eurasien som är temat.
Attributdata
Data hämtades från följande fem studier:
Helgason et al. (2000)[7]: Svenskar, norrmän, danskar, tyskar, islänningar, britter, irländare, skottar, ryssar, italienare, greker. Indelningen i haplogrupper är tyvärr ganska grov, och antalet provtagna personer varierar kraftigt, mellan 12 danskar och 332 italienare, med 106 som medeltal (110 svenskar deltog). Den största nackdelen med det använda systemet för haplogrupper (a i YCC; se Figur 2-3) var att det inte skiljde mellan G och I, och därmed inte kunde skilja mellan neolitiska invandrare till Europa, och Europas äldre ursprungsbefolkning. Man kan heller inte plocka ut vare sig R, R1, R1a, eller R1b.
Karafet et al. (2001)[8]: Analyserade tjugofyra folkslag från Öst- och Centralasien, plus att han-kineser ("äkta" kineser) delats upp i en nordlig och en sydlig grupp. Mellan 13 och 147 personer analyserades, i medeltal 55. De använde klassifikationssystem d enligt YCC. Ingen information om haplogrupp G, H, I eller R1a1.
Qamar et al. (2002)[9]: Undersökte tolv folkslag från Pakistan och den av Pakistan ockuperade delen av Kashmir. Antalet individer som analyserades per folk varierade mellan 12 och 122, i medeltal 60. Liksom Helgason et al. (2000) använde de system a för klassificeringen.
Semino et al. (2000)[10]: Analyserade tjugofem grupper från kontinentala Europa och Mellanöstern, ibland per land, men ofta från en del av ett land (Baskien, Sardinien, Udmurt). Mellan 16 och 77 personer per grupp, i genomsnitt 40. Klassificerade i system e. Systemet ger värden för G, H, I, R1 och R1a1, men inte för R, R1a eller R1b.
Wells et al. (2001)[11]: Dessa analyserade 49 grupper från Eurasien; från Orkneyöarna i väster till Korea i öster, från Norra Ishavet i norr till Indiens sydspets i söder. Fokus låg på Centralasien, och syftet var att ta reda på hur centralasiaterna var besläktade med omkringboende folk. Därför har vissa folk delats upp i regioner, ända upp till 7 geografiska enheter för uzbekerna i Uzbekistan. På andra platser med en multietnisk befolkning, till exempel Samarkand, finns flera populationer från samma plats. I vissa av dessa fall har den utländska befolkningen strukits från kartdatabasen, i andra fall har den fått en liten cirkel eller liknande för att resultatet skall kunna synliggöras. Totalt delade författarna in proven i 49 grupper, med mellan 12 och 129 personer per grupp, i genomsnitt 40. Indelningen i haplogrupper gjordes inte med något av de system som beaktades av YCC, utan genom att ange mutationen (t.ex. "M96"). I de flesta fall kunde denna mutation identifieras på släktträdet, och haplogruppen klassificeras i samma system som de övriga. Liksom i de andra fallen kunde inte vissa haplogrupper särskiljas, till exempel G, J, R och R1a.
Samtliga data sammanställdes i en tabell med procenttal, med klassificering enligt YCC (jämför Figur 2-3). I de fall (Mongoliet, Korea, Tyskland, Storbritannien) då data fanns från två studier, valdes den studie som hade störst statistiskt urval, utom för de haplogrupper som bara hade identifierats i den andra studien. Det uppstod naturligtvis luckor i tabellen för många kombinationer av plats och haplogrupp.
Utgångspunkten var en vektorkarta över världens länder (en generalisering av WDB II). Data som hänförde sig till hela länder kopplades helt enkelt till dessa i det geografiska informationssystemet (GIS). Länder varifrån det fanns flera urval delades upp, och data kopplades till respektive del. Om dessa detaljerade data inte täckte hela landytan, och det fanns andra data som representerade landet som helhet, så användes dessa senare data för restytan.
I de fall då urvalet representerade ett folk och inte en namngiven geografisk region, blev det nödvändigt att söka finna en karta över detta folks utbredning (inom det land det gällde; vissa folk finns ju i flera länder, men i data var det alltid angivet inom vilket land folket provtagits). I de flesta fallen hade folket sitt eget språk, och kunde därför återfinnas i en databas över all världens språk (URL: http://www.ethnologue.com/; den listar de 6800 huvudspråken samt 41000 alternativa namn och dialekter).
I några fall, exemplifierat av hui i Kina, rörde det sig om en minoritet av annan etnisk bakgrund som dock talade majoritetsfolkets språk. I dessa fall är det sällan fråga om en territoriell minoritet ("stamfolk"), utan om en etnisk minoritet som är mer eller mindre uppblandad med majoritetsbefolkningen. De lokaliserades så gott möjligt med hjälp av sökningar på Internet, och placerades på kartan genom att området där de fanns delades rumsligt med en slumpvis avgränsning mellan de olika folk som delar på området. Till exempel är uigurerna kopplade till provinsen Xinjiang i västligaste Kina, och hui till en del av Kina omedelbart öster om dem, trots att det numera även bor han-kineser i hela det området.
Figur 2-4 visar polygonernas läge och vilket folk de representerar. Observera att en cirkel har lagts till väster om Orkney för att göra det möjligt att se färgen på den ögruppen.
Figur 2-4. Nyckelkarta för Y-kromosomdata (gäller även Plansch 2-1). Eftersom data är tagna från flera olika studier, är det lite varierande vad de representerar. Vissa representerar ett slumpvis urval från ett land, men de flesta av proven representerar ett folk. Många av dessa har ett eget territorium, men inte alla — i det senare fallet är denna karta nödvändig som nyckel för att se vilken polygon som har kopplats till vilket folk. Ortografisk projektion med centrum 45º N, 60º O.
De fylogeografiska kartorna över haplogruppernas fördelning i Eurasien redovisas på Plansch 2-1. Den första raden visar haplogrupperna A, C, D, E och F. Tillsammans med B (som förefaller saknas i Eurasien) representerar de samtliga haplogrupper. A och B är afrikanska haplogrupper, även om det inte framgår av kartorna.
Kommentarer till utbredningskartorna
Haplogrupp C förekommer i ansenlig mängd hos Sibiriens jakuter, samt hos kazakerna och mongolerna. På ön Sakhalin öster om Sibirien och norr om Japan finns ett litet folk, Oroqen, som hade 91% haplogrupp C i provet. Med tanke på hur nära släktträdets stam C ligger, kan man gissa att det handlar om en mycket gammal invandring, från långt före istidens maximum. Så hur klarade de istiden i Sibirien? Eftersom frekvensen är högst på Sakhalin kan man hypotetisera att de levde i isolation i ett refugium på den kusten, norr om Korea, och därifrån spred sig västerut då klimatet förbättrades igen. Således hade sibiriska evenker 68%, buryater 60%, mongoler 52% - 59%, och kazaker 40% - 66% beroende på studie. Samtliga dessa talar altaiska språk. Altaierna däremot hade bara 24% — istället hade de en för Asien hög frekvens av R1a (se nedan). Och uigurerna hade inte mer än 7% haplogrupp C, trots att de också talar altaiska språk. Där de ligger på sidenvägen i västligaste Kina är de en blandning av ett flertal folk, men den dominerande haplogruppen är den europeiska R1. Tills för bara ett årtusende sedan talades det där ett indoeuropeiskt språk, men så tog ett turkiskt folk och språk överhanden.
Haplogrupp D har högst värden i Tibet, men har också spritts till angränsande områden i mindre mån. Den ligger på samma gren som följande grupp.
Haplogrupp E har synbarligen sitt centrum i Mellanöstern, i Levanten. Högst frekvens uppvisar Libanon (29% och 32% hos Semino respektive Wells), men samma storleksordning förekommer i Grekland (24% hos Semino, 33% hos Helgason[12]). Aningen lägre frekvens förekommer i norra och centrala Iran (21% - 25%) och i Albanien (21%). Turkiet uppvisar 13%, Sardinien 12%, och Andalusien 10%, medan resten av kontinentala Europa varierar mellan sådär 2% och 8%. Detta är uppenbart en haplogrupp som kommit till Europa efter istiden, från Mellanöstern. Den kan ha kommit dels med den neolitiska revolutionen, dels med handel (fenicierna bodde som bekant i dagens Libanon), dels med de muslimer som ockuperade delar av Spanien under nästan tusen år.
Haplogrupp F har frekvenser på långt över 50% hos de flesta provtagna folk i Eurasien. Enda undantaget är de där C eller D dominerar (altaiska respektive tibetanska folk). Det betyder att F dominerar över hela Europa och över ungefär halva Asien till ytan räknat. Räknat i folkmängd är dock F totalt dominerande även i Asien. Den kartbild vi ser för F är resultatet av många tiotusentals år av befolkningsutveckling, med expansion över stora områden. Hur denna expansion gått till går inte att säga utan mera detaljerade analyser. Som ett första steg går vi därför in och tittar på undergrupperna till F, vilka återfinns i nästa rad av planschen.
Haplogrupp G kan bara identifieras i en av de nämnda studierna, och i den har G högst frekvens i Georgien med 30%. Därnäst följer Sardinien med 14%, centrala norra Italien med 10%, Katalonien och Kalabrien båda med 8%, samt Turkiet med 7%. Inga data fanns från Iran, men å andra sidan fanns där uppgifter för H, I och J2, förutom F och K. Det betyder att frekvensen av G + J1 (samt J*) kan beräknas, och den visar sig vara kring 40%. Nu finns förmodligen J1 i Iran, men man kan ändå gissa att andelen G är avsevärd också. Andelen i Grekland låg, under 3%. Semino et al. (2000) tolkade G (jämte E, F1 och J) som indikatorer på invandring från Mellanöstern under neolitikum.
Haplogrupp H har högst frekvens hos yadhava (ett dravidiskt folk) i södra Indien, 19%. Därnäst följer de andra två sydindiska folken (ett av vilka är nyliga indoeuropeiska invandrare), och därefter romani (förr: zigenare) i Uzbekistan och tadzjiker i Dusjanbe i Tadzjikistan; bägge de senare har 13% H. Däremot hade tadzjikerna i Khoiant 0% H. Man kan gissa att haplogruppen kommer från Indien eller Sydostasien (från det senare området fanns inga data).
Haplogrupp I uppvisar högst frekvens hos kroaterna, 45%, tätt följda av samerna (förr: lappar) med 42% enligt samma studie (Semino et al. 2000). Tyskland och Sardinien låg båda kring 38%, medan Kalabrien hade exakt 0%. Samernas språkfränder udmurterna (förr: votjaker) och marierna (förr: tjeremisser), som bor kring Volgakröken, hade endast 7% respektive 4%. Från Skandinavien fanns inga data, men åter om detta senare.
Haplogrupp J fanns endast redovisat från undersökningar i Asien. Därför presenteras istället J2 på Plansch 2-1, för att få lite europeiska data. Den i särklass högsta frekvensen återfanns hos det sydkaukasiska folket kazbegi i norra Georgien, vilka uppvisade 72% J2. Grannfolket svaneterna hade 0%. Näst högst var istället azererna i Azerbajdzjan med 48%, och folk i Turkiet med 40%. Även i Libanon var talen höga, kring 30%, liksom i Tadzjikistan. Detta placerar J i ungefär samma del av världen som haplogrupp G.
Haplogrupp K, slutligen, är den i särklass största undergruppen till F. Fördelningen av K i Eurasien uppvisar flera lokala centra, vars tillblivelse kan bero på flera faktorer. Dessa centra — som de framgår av de tillgängliga data — är Kina, Tadzjikistan, folken kring Uralbergen, Baskien, samt gaelerna på Brittiska Öarna. Liksom fallet var med F måste man se på underhaplogrupperna för att upptäcka något meningsfullt mönster i kartbilden. Men först en sammanfattning av F.
F inhyser som sagt haplogrupperna G, H, I, J och K. Tyvärr finns endast data för F och K från Skandinavien. Dessa data visar att majoriteten av de provtagna personerna tillhörde F men inte K. Denna differens har plottats som "F minus K" på Plansch 2-1. Detta är det enda undantaget, den enda karta som är flerfylig. Orsaken till undantaget är att det är det enda sättet att åskådliggöra den haplogrupp som dominerar i Sverige. Logiskt sett är det en okänd blandning av F*, G, H, I och eller J, men eftersom vi ser att svenskarnas grannar (tyskar, samer... ) av dessa haplogrupper endast har I, så kan vi förmoda att nästan hela den andelen om 54% för Sveriges del representerar I (i Norge 51%). Kartans andra mörka område, Mindre Asien, representerar en blandning av G, I och J, med betoning på J.
Därmed över till haplogrupperna under K.
Haplogrupp L har sitt högsta värde hos de dravidisktalande kallarerna i delstaten Tamil Nadu i södra Indien, med 48%. Eftersom även balucherna i Pakistan har höga värden (29%) får man förmoda att haplogruppen har sitt ursprung hos de dravidiska folken i Indien. Endast i Kalabrien, Andalusien, Ungern och Grekland påträffades personer med denna haplogrupp i Europa (frekvens 5%, 3%, 2%, respektive 1%).
Eftersom inga data fanns från haplogrupp M i Europa, och alla data från östra Asien hade värdet 0 (noll) utom Malaysia med 3%, så visas inte denna karta. Enligt Su et al. (1999)[13] är detta en exklusivt Oceanisk haplogrupp.
Även haplogruppen N led av brist på data, medan däremot dess undergrupp N3 var bättre representerad. Eftersom N3 är karaktärshaplogrupp för samerna (ca 40%) visas den kartan istället. Allra högst frekvens hade N3 hos marierna vid Volga, med 70%. Även buryaterna i Sibirien hade ganska höga värden, 28%.
Haplogruppen O är av allt att döma centrerad i södra Kina, där frekvensen når 100% hos folken zhuang och she. På Taiwan och i Korea är frekvenserna över 80%, hos kineser, vietnameser och malaysier mellan 70 och 80%. Man kan uppskatta att uppåt en miljard människor har denna haplogrupp.
Den sista haplogruppen under K är P, bildad för cirka fyrtio tusen år sedan. Det är också den sista fullständiga kartan i serien. Det högsta värdet för P noterades från Orkneyöarna: 92%. Nästan lika höga värden noterades i spanska Baskien, med 89%. Därefter följer dels Skottland och Irland, dels Kashmir, med ca 83%. Denna haplogrupp har en vidsträckt utbredning, med höga frekvenser från Brittiska Öarna i väster till Amerikas indianer i öster.
Underhaplogruppen P1 har däremot en mycket begränsad spridning. Endast hos romani i Uzbekistan dominerar den, med 53% (av det undersökta materialet; som alltid måste man reservera sig för att man kan ha missat en verklig "hot spot"). Bartangi i Tadzjikistan har 17%, de dravidisktalande yadhava i Tamil Nadu samt tadzjiker i Khoiant i Tadzjikistan följer med 9% (de senare har 64% R1a1). Haplotypen förefaller höra hemma i Centralasien (antikens Baktrien och Sogdiana), eller — troligare — i det icke provtagna området i norra Indien.
Haplogrupp Q är intressant framför allt genom sin undergrupp Q3, vilken dominerar bland Amerikas indianer. I Eurasien har Q en östlig utbredning, och låga frekvenser.
Huvuddelen av P utgörs av R, och eftersom data för R saknas från många platser kan man därför tjuvtitta på kartan för P istället. Därför har heller inte någon karta gjorts för R.
R domineras dessutom helt av sin underhaplogrupp R1, vilken beräknas ha bildats för cirka trettio tusen år sedan. R1 består i sin tur av R1a och R1b, vilka dominerar i Östeuropa respektive Västeuropa. R1a i sin tur är i huvudsak representerad av R1a1, och det är denna som har kopplats samman med indoeuropéernas expansion österut.
Tre haplogrupper dominerar i Europa, och samtliga kom till kontinenten före nedisningsmaximat (det var som kallast för ca 25000-15000 år sedan). Figur 2-5 visar haplogrupp I, den som dominerar i Skandinavien.
Även om I dominerar i nordligaste Europa, så dominerar en annan haplogrupp på "kontinenten", nämligen R1. Den är emellertid uppdelad på två typer, R1b och R1a1, med klart olika utbredning (Figur 2-6 respektive 2-7).
Frekvenserna av R1b i Figur 2-6 är beräknade genom att subtrahera R1a1 från P. Eftersom ingen Q verkar finnas i Europa, så motsvarar det ungefär att subtrahera R1a1 från R (jämför Figur 2-2). Frekvensen av R1* och R1a* är låga men inte noll. De mörkare tonerna i Ryssland och Armenien kan orsakas av dessa, snarare än av R1b. Därför kan man inte enbart utifrån denna karta dra några slutsatser om att västeuropéer dragit till Asien. Dock finns det direkta mätningar från Centralasien, som visar att Kinas uigurer har 17% R1b. Eftersom uigurerna assimilerat den tidigare indoeuropeiska befolkningen (nu kallade tokharer), och tokhariskan är släkt med armeniskan (och germanska språk), så kan man dock med visst fog misstänka att den mörka gråtonen i Armenien också verkligen orsakas — åtminstone delvis — av R1b.

Figur 2-5. Frekvensen av haplogrupp I i Europa och Mindre Asien. För de nordiska länderna redovisas alla haplotyper av typ F som inte är typ K, eftersom data antyder att frekvensen av F1, G, H och J är försumbar (I ‚âà F — K). Högst frekvens har Sverige med 53%, följt av Norge, Kroatien, skandinaviska samer, Sardinien och Tyskland. Sardinien domineras dock helt av haplotyp I1b2, vilken de delar endast med Baskien. Kalabrien har 0% I. Ortografisk projektion med centrum 45¬ƒ N, 15¬ƒ O.

Figur 2-6. En approximation av utbredningen av haplogrupp R1b (se texten för beskrivning). Högst frekvens återfinns hos baskerna, följt av Irland.

Figur 2-7. Frekvensen av R1a1. Högst andel på denna kartbild har Ungern med 60%, följt av Polen med 56% och Ukraina med 54%. Jämför också nästa figur.
Trots att frekvensen av R1a1 är något högre bland vissa folk i Centralasien än i Östeuropa, menade forskarna bakom studien ändå att Ukraina var detta folks urhem, eftersom flest varianter av R1a1 fanns där. Centralasien var dels den väg indoeuropéerna kom in i Indien, på den tiden då Indus-kulturen[14] florerade i det som nu är södra Pakistan. Det nordligaste dravidisktalande folket finns i denna trakt. Dessa brahuier har uppåt 39% av R1a1. Det är lika mycket som det sydligaste indoeuropeisktalande folket i södra Indien, sourashtran. Siffrorna visar hur folken blandats upp med sina grannar på respektive plats.

Figur 2-8. Frekvensen av R1a1 i Centralasien. Ishkashimi i Tadzjikistan (en liten folkspillra på gränsen till Afghanistan) har hela 68%, vilket kan vara en följd av genetisk drift. De är dock tätt följda av tadzjiker i distriktet Khoiant med 64%, och kirgiser i hela Kirgistan med 63%. I Pakistan har kashmirerna 58% och sindhi 49% — och, anmärkningsvärt, det tibetisktalande folket balti högt i Himalaya har 46%.
Samtidigt som de dravidisktalande brahuierna har 39% R1a1, har de indoeuropeisktalande hazarerna i Pakistan 0%. Deras egen mytologi säger att de härstammar från Djingis khans armé, och det faktum att de har 30% C antyder att det är möjligt. Vad det visar är hur lite språket säger om ett folks ursprung.
Av kartan i Figur 2-9 framgår att haplotyp N3 är koncentrerad till samma område där finsk-ugriska och besläktade språk talas.
Lahermo et al. (1999)[15], kom fram till att N3-mutationen (Tat polymorfism) är ca 4440 år gammal (95% konfidensintervall är 3140 — 6200 år). De fann att den saknas hos ungrarna, och är vanligast hos khanterna (som bor i västra Sibirien, kring nedre — alltså norra — Ob). Hos letterna finns N3 med 30%. På kartan i figuren är frekvensen högst hos marierna (förr tjeremisser; vid Volga), med 70%.

Figur 2-9. Frekvens av Y-haplogrupp N3. Utbredningsmönstret i kombination med mutationens ringa ålder talar för att vi här står inför en tydlig expansion i relativt sen förhistorisk tid.
Samerna (förmodligen avses de skandinaviska) har knappt 42% N3 enligt Semino et al. (2000), alltså inte så hemskt mycket mer än letterna. Man kan förvänta att esterna borde ha lika mycket eller mer N3 än letterna, med tanke på att esterna är rent finskugrisktalande, medan Lettland historiskt består av en blandning av diverse finsk-ugriska grupper (liver, kurer, etc.) och de baltiska letterna (latgaller, semgaller, etc.).
I Sverige finns N3 med dryga 7%, i Norge med under 3%, enligt Helgason et al. (2000)7. Dessa värden avser med all sannolikhet majoritetsbefolkningen i den södra halvan av respektive land. Varför skulle Sverige ha så mycket mer N3 än Norge, om källan var samerna? Vi kan nog lugnt anta att det inte är från samerna som svenskarna har fått N3-haplotypen, utan från andra sidan Östersjön.
Emellertid, låt oss inte gå resonemangen i förväg nu. Senare i texten skall vi se lite på hur haplogrupperna kan ha spridits, och hur landet kan ha befolkats. Detta kommer att ligga till grund för ett försök att göra en förhistorisk historieskrivning i senare texter. Men här och nu skall vi titta på släktskap på mödernet, som det återspeglas av mtDNA.
Mutationshastigheten för
mtDNA är hög, vilket har resulterat i att en lång rad neutrala variationer i
koden har ackumulerats. Det genomsnittliga antalet skillnader i mtDNA mellan
två individer har uppskattats vara mellan 9,5 och 66. De neutrala variationerna
varierar med befolkningsgrupp, och kan därför användas för att studera
släktskap. Variationerna har ackumulerats i olika serier längs olika grenar av
släktträdet från en gemensam anmoder. Samtidigt som den genetiska koden har
förgrenats på detta sätt, har folkgrupperna avskiljts från varandra genom
folkvandringar till andra delar av världen — eller därför att en skiftande
natur har separerat dem med inlandsisar, hav, öknar och så vidare. De kvinnor
som var grundare av en ny population gav det folket en viss uppsättning
ursprungliga mtDNA-haplotyper, som nu återspeglas i form av grupper av
besläktade mtDNA-haplotyper. Är dessa grupper närbesläktade så är det troligt att
de respektive anmödrarna var från samma population; är de däremot väldigt
olika, så kan de återspegla olika invandringsvågor till samma trakt. Men samma
situation kan uppkomma om det invandrade folket i sig var en blandning av två
grupper från olika delar av släktträdet.
Den mest variabla regionen i människans mitokondrie-DNA är D-slingan, och de flesta polymorfa ("mångformade") ställen i denna slinga är koncentrerade i två så kallade hypervariabla segment, HVS1 och HVS2, som nämndes inledningsvis. Den övervägande delen av DNA-sekvensdata som har publicerats är begränsade till HVS1. Dessutom har analyser av släktskap gjorts genom att dela upp DNA-molekylen i fragment och se hur dessas längd varierar (RFLP, restriction fragment length polymorphisms).[16]
Kodnings- och
klassifikationssystemet för mtDNA-haplogrupper bygger på kapitäler som
betecknar grupper av närbesläktade haplotyper. Systemet är liknande som för
Y-haplogrupper, men de har inget med varandra att göra, och när det gäller
mtDNA finns det ingen logisk ordning i systemet. Det har växt fram beroende på
slumpen. Att A, B, C och D är haplogrupper hos Amerikas indianer är till
exempel en effekt av att systemet skapades i en undersökning i USA. Först
senare har det klarlagts hur dessa är släkt med varandra. Systemet
vidareutvecklades i en europeisk studie på svenskar, finnar och italienare, och
då lades till exempel T, U, V, W och X till.
Figur 2-10. Generaliserat släktträd för mitokondrie-DNA. Baserat på en kombination av släktträd från Europa och Asien. Den stora variabiliteten inom Afrika har förenklats till den enda haplogruppen L — i själva verket är både M och N underhaplogrupper till L3a. Förenklingarna består dels i att många geografiskt isolerade underhaplogrupper eliminerats, dels i att mellanliggande stadier (t.ex. pre-HV) utelämnats. Åldersuppskattningarna är från varierande källor och platser, vilket betyder att de samtliga ger minimiåldrar för mutationen, men dessutom har de ofta stor osäkerhet. Inom parantes redovisas åldersuppskattningar för vissa haplogrupper i Sverige — Finland (dessa är från Torroni et al. 1996). Mutation T1 har daterats till 16.700 — 28.400 i Mellanöstern, 6.100 — 12.800 BP i Europa av Richards et al. (2000)24.
Tio haplogrupper stod för
nästan alla varianter av mtDNA bland dessa folk. Ungefär 99% av variationen
representerades av haplogrupperna H, I, J, K, M, T, U, V, W och X, enligt
Torroni et al. (1996).[17]
Som framgår av Figur 2-10 har dock forskarnas syn på släktträdet förändrats en
hel del sedan dess, och vi kan säkert förvänta oss ytterligare förändringar
inom de närmaste åren. Till exempel är K nu en undergrupp till U, som delats
upp i många varianter som skiljs med en siffra.
Figur 2-11. Haplotyper för mtDNA förankrat i en neandertalsekvens. De flesta data som trädet baseras på är från européer, varför de afrikanska grenarna (L) är väldigt förenklade — i verkligheten finns mycket mer variation i Afrika än i Europa. Från Macaulay et al. (1999).[18]
I Europa är haplogrupp H i
särklass vanligast — hälften av alla européer har den. Även J, T, K och U är
vanliga, och representerade hos samtliga europeiska folk. De övriga (I, V, W
och X) är vitt spridda i låga frekvenser, men med lokala koncentrationer.
Ungefär 76% av alla
afrikanska mtDNA-sekvenser hör till haplogrupp L1 eller L2 (se Figur 2-11).
Omkring 55% av östasiaterna och sibirierna hör till övergrupp M (som inkluderar
undergrupperna C, D, E, G), medan de flesta övriga har A, B eller F. I
stort sett alla indianers mtDNA faller in i någon av haplogrupperna A, B, C,
eller D, men i Nordamerika finns även några procent av X.
Mitokondrie-DNA muterar snabbt, och antalet baspar i HVS1 är ganska litet. Det har lett till att vissa positioner har muterat flera gånger i människans senare historia (de senaste 50 tusen åren eller så). Det leder i sin tur till att det kan vara svårt att veta hur släktträdet ser ut, eftersom en viss haplotyp ibland lika väl kan vara en kvist på den ena grenen som på den andra grenen. Eftersom kartorna baseras på ett antal olika artiklar, så kan det dessutom hända att vissa haplotyper också har klassificerats olika i olika studier.
Vissa haplotyper som är helt lika i HVS1, hör ändå inte till samma gren och kvist på släktträdet. De kan skilja sig i andra delar, och slumpen kan ha gjort att mutationerna lett till samma haplotyp via olika vägar. I sådana fall måste man göra ytterligare analyser för att kunna tilldela en otvetydig haplogrupp.
Det är också något osäkert, när det gäller mtDNA, hur olika haplotyper och haplogrupper är besläktade med varandra. Huvuddragen är förmodligen riktiga, men lika sannolikt är det att detaljerna kommer att måsta ritas om många gånger framöver.
Ett annat antagande som ligger bakom användandet av mtDNA för att studera människans släktskap är att de variationer man tittar på inte påverkats av det naturliga urvalet. En nyligen publicerad artikel påstår emellertid att det antagandet inte är riktigt riktigt, så att säga (se faktaruta).
Naturligt urval av mtDNA Mitokondrie-DNA kodar 13 polypeptider som behövs i ämnesomsättningen, alltså omvandlingen av kalorier i födan till ATP, musklernas "drivmedel". Eftersom vi är varmblodiga så måste en del kalorier också gå till att upprätthålla kroppstemperaturen. Om verkningsgraden är låg i omsättningen av kalorier till ATP, så går mera av födan till att höja kroppstemperaturen. Det är en fördel för folk i kalla klimat. Om en mutation uppstår som ökar individens överlevnadsvärde, så kommer den haplogrupp i vilken mutationen skedde att öka i frekvens, eftersom ingen omkombinering sker av mtDNA. Och eftersom mtDNA förmodligen är den viktigaste metoden för att anpassa sig genetiskt till ändringar i klimat eller föda, så följer det att man borde kunna förvänta sig en samvariation av haplotyp och klimat som ett resultat av det naturliga urvalet, även om man klassificerar haplotyperna efter de neutrala mutationerna. Detta har påpekats helt nyligen av Mishmar et al. (2003)[19]. De visade även att det fanns klara globala skillnader i mutationsfrekvens. Till exempel har arktiska folk hög frekvens av icke-neutrala mutationer i genen för aminosyran ATP6, medan europeiska folk har hög mutationsfrekvens i genen för Cytb, och tropiska folk i genen för ND3. Detta betyder att en hel del av den storskaliga variationen i haplogruppfrekvens kan bero på klimatet. Det finns redan bevis för att de olika haplogrupperna är funktionellt olika. Haplogrupp T är associerad med minskad spermierörlighet hos europeiska män, och J är associerad med högre livslängd i Europa. Det följer också av detta, att om folk byter klimat och eller diet, så kan en "missanpassad mitokondrie" ge upphov till fenomen som övervikt och hjärt-kärlsjukdomar enligt forskarrapporten. De utfärdar också en varningsflagga för att denna effekt kan göra att tidigare beräkningar av tidpunkten för människans spridning kan behöva revideras. Eftersom inga nya data framkommit som tagit denna rapport i beaktande, så redovisas här de tidigare beräkningarna, dock med denna brasklapp.
Nå, om urvalet verkar så faller ju hela premissen för att använda DNA. Hela? Nej, inte riktigt, för fortfarande kan man kartera skillnaderna. Beräkningar av befolkningstäthet i forntiden och liknande kanske man skall akta sig för, men att objektivt kartera släktskap i nutiden kan man naturligtvis fortfarande göra. Och fortfarande kan det ge upplysningar om folkförflyttningar i nära förhistorisk tid, på kortare sikt än det naturliga urvalet hinner verka effektivt.
För att få en bättre
rumslig bild av utbredningen av haplogrupper förfors på samma sätt som med
Y-kromosomdata. En databas sammanställdes från olika studier, och tematiska
kartor framställdes.
Attributdata
Följande artiklar har använts som källor för mtDNA-data:
Helgason et al. (2001)[20] undersökte varifrån Islands kvinnor
kommit. De rapporterade dels data från små områden som Orkney och Hebriderna,
dels sammanslagna data från stora områden som Skandinavien, Bulgarien plus
Turkiet, Frankrike plus Italien, etc. Sammanlagt hade de data från 15
geografiska områden av mycket varierande storlek och heterogenitet, och med
mellan 102 och 891 personer per område, i genomsnitt 331.
Torroni et al. (1996)[21]
analyserade DNA från 49 finnar, 37 svenskar och 48 italienare från Toscana, den
region där etruskerna levde.
Finnilä et al. (2001)[22]
undersökte 480 personer hemmahörande i norra Österbotten, mellersta
Österbotten, Kajanaland (Kainuu) och norra Savolax (Savo). På kartan visas de
som "N Finland".
Pereira et al. (2000)[23]
undersökte 100 personer från norra Portugal, 82 från mellersta, samt 59 från
södra delen av landet. I databasen slogs de ihop till 241 personer från
Portugal (med undantag för kartan över T1).
Macaulay et al. (1999)18 undersökte
50 adygier, ett nordkaukasiskt folk i sydligaste Ryssland, samt 45 druser
samplade i norra delen av nuvarande Israel. Eftersom de flesta druser bor i
södra Libanon (och en del i Syrien) placerades deras data på Libanon snarare än
på Israel (dessa data är endast med på några av kartorna).
Richards et al. (2000)[24] undersökte ett antal folkgrupper i
nordöstra Afrika och i Mellanöstern, och jämförde dem med geografiskt
sammanslagna data från olika geografiska regioner i Europa. Bland folkgrupperna
som undersökts kan nämnas nubier, beduiner (de som egyptierna kallar "araber"),
egyptier, palestinier, syrier, irakier, jemeniter, kurder och turkar. Somliga
data är kompilerade från andra studier. Antalet individer per population som
undersökts varierar mellan 29 och 456, med ett medel av 171. Dessutom var Iran
med, men med endast 12 undersökta individer måste data därifrån betraktas som
exempel, inte som ett statistiskt urval (det enda som kan sägas om Iran är att
haplogrupp H sannolikt dominerar).
Kittles et al. (1999)[25] redovisade en undersökning av både
NRY och mtDNA från finnar, från skåningar från Lund, från vita amerikaner, samt
från två indianstammar i USA. Från deras appendix gick det att få fram
haplogruppfördelningen för mtDNA för skåningarna, och dessa data har använts
(28 individer). Det skall påpekas att det finns några tryckfel i artikeln
(muntlig uppgift från Rick A. Kittles); deras position 19 motsvarar position
16042 i Cambridge Reference Sequence, inte 16043 som det står i artikeln.
Vidare var det 45 skåningar som provtogs totalt (och 39 cheyenner), men bara 28
av analyserna lyckades. Trots det ringa statistiska underlaget är ändå detta en
mycket intressant studie, eftersom den behandlar ett så geografiskt och
etnografiskt välavgränsat område: Den skånska slätten.
Av Figur 2-12 framgår vilket folk som är återgivet var på de följande kartorna.
Figur 2-12. Nyckelkarta för de följande figurerna med kartor över utbredningen av haplotyper för mitokondrie-DNA (gäller även plansch 2-2). I flera fall fanns dels en studie med sammanslagna data (t.ex. Finland-Estland), dels data för en mindre del av detta område (N Finland). Den mindre delen är då visad på rätt plats, och de sammanslagna data visas för resten av området. "S Finland" avser data som ursprungligen endast kallades "Finland", men eftersom proven togs i Helsingforsområdet visas data där. Likadant avser "V Götaland" data som ursprungligen kallades "Sverige", men alla prov togs på medicinstudenter i Göteborg, varför data visas på Göteborgs universitets huvudsakliga upptagningsområde.
Den moderna människan,
Homo sapiens sapiens, anses allmänt härstamma från Afrika. En av de afrikanska
grenarna, L3a, spreds via Mellanöstern till Eurasien. Haplogrupp M finns
huvudsakligen i Östasien, medan N finns i hela Eurasien. Från haplogrupp M
finns i stort sett endast Z (en undergrupp till M8) representerad i Europa, med
några procent hos bland annat samerna.
Haplogrupp N förgrenas i
ett antal grenar med olika skenbar ålder. N9 och A förekommer huvudsakligen i
Östasien. R är den dominerande grenen till utbredning och frekvens. De
huvudsakligen europeiska haplogrupperna I, W och X förekommer i låga frekvenser
över i stort sett hela kontinenten, med karaktäristiska lokala toppar i
koncentrationen (Figur 2-13 till 2-15).
Genom att studera
släktträdets utseende i Europa och Mellanöstern, försökte Richards et al. (2000)24 att
avgöra vilka haplogrupper som utvecklats var. Just när det gäller dessa tre (I,
W och X) var det emellertid inte möjligt att avgöra om de hade sitt ursprung i
Europa eller Mellanöstern (en tredje möjlighet är förstås att de inte kommer
från någotdera av de studerade områdena).

Figur 2-13. Frekvensen av mtDNA-haplogrupp I (svart betyder >10%). Värdet i Iran bör vi bortse ifrån; det var en person av 12 som hade I. Yttre Hebriderna hade 6,5%, därefter följer en rad områden med mellan 4 och 5%, bland annat Egypten, Balkan och Toscana.

Figur 2-14. Fördelning av haplogrupp W. Norra Finland har högst frekvens med 9,5%, följt av kurder med 7,5%.
Haplogrupp X är en
kuriositet (Figur 2-15), eftersom det är den enda som finns både i Europa och
hos Nordamerikas indianer (frekvens: 3%) men inte i östra Asien. Högst frekvens
har den hos druserna (data från Macaulay et al. 1999) 18, en shiitisk
religiös sekt som huvudsakligen finns i Syrien och Libanon, dit de flydde från
Egypten år 1017 e.Kr.[26]

Figur 2-15. Fördelning av haplogrupp X. Högst frekvens har druserna med hela 27%, följt av etruskernas efterföljare i Toscana med 8,3%, och orkneyborna med 7,2%. Notera att redan 10% ger svart färg, så skillnaden i frekvens mellan Toscana och druserna är mycket större än vad kartan antyder.
Druserna bor nära där fenicierna förr bodde. Det vore väl märkligt om druserna inte hade beblandat sig med dem som bodde där tidigare, varför man kan undra om inte haplogrupp X var vanlig hos fenicierna.
Näst högst frekvens uppmättes i Toscana, där etruskerna förr bodde. Och därnäst kom Orkneyöarna i Nordatlanten. Det allra mest spännande med X är emellertid att den också finns hos Nordamerikas indianer, men inte i Asien. Så hur kom den dit?
Det svårt att inte komma till slutsatsen att den måste ha kommit till Amerika över Atlanten. Med tanke på hur spridd X är i Nordamerika — uppenbarligen en följd av att också indianstammarna där migrerat lite slumpvis — så ligger det närmast till hands att misstänka att drusernas anfäder seglade till Amerika någon gång för bra länge sedan. Frågan är däremot vilka dessa anfäder var — som vi skall se senare verkar de inte ha bott i Mellanöstern.
Haplogrupp R delas upp i
ett antal grenar, där R9 och B huvudsakligen förekommer i Östasien (liksom de
tidigare nämnda N9 och A). Dessa två asiatiska grenar har hög ålder (81
respektive 75 tusen år), medan de europeiska grenarna förefaller yngre. Detta
behöver dock inte betyda att de verkligen är yngre. Det kan lika väl bero på
det faktum att Europa blev en mycket ogästvänlig plats under istiden, med
relativt små och isolerade områden lämpliga för mänsklig bosättning.
Av "döttrarna" till R är
det HV, JT och U som är av intresse i Europa. Den förra förefaller exklusivt
europeisk och har låg skenbar ålder (26 tusen år), de övriga finns även i
Mellanöstern och har högre ålder. Men det finns en föregångare till HV i
Mellanöstern, kallad pre-HV. Den förekommer med 26% i Jemen, och 17% hos
beduiner. Detta visar att även HV har nått Europa från det hållet.
Haplogrupp U har daterats
till 56 kBP (tusentals år före nutid) i Europa, och samma ålder i Skandinavien
— Finland. Det antyder att den skandinaviska befolkningen inte är skiljd från
den kontinentala via någon flaskhals orsakad till exempel av en folkvandring
till ett nytt område, och heller inte av någon befolkningskris orsakad av till
exempel högistiden kring 25 — 15 kBP. Dessa haplogrupper finns återgivna på
Plansch 2-2. Kartbilden är emellertid ganska ointressant och jämngrå när man
ser på denna nivå. Det är först när man kommer in på mera specifika kluster av
haplotyper som kartbilden klarnar. Så låt oss gå vidare till nästa nivå.
Haplogrupp HV delar sig i
H och V. Haplogrupp H är totalt dominerande i Europa (Figur 2-16).

Figur 2-16. Frekvens av haplogrupp H (notera att svart = 100%). Allra högst är frekvensen kring Biscayabukten, med 59% hos baskerna. Data från Iran har stor osäkerhetsmarginal.
En av anledningarna till
att det sagts att Europa är så homogen vad gäller mtDNA är just att haplogrupp
H är såpass jämnt spridd. Men som siffrorna från Skåne visar, så kan denna
homogenitet vara skenbar; en artefakt orsakad av bristande rumslig upplösning i
data. Vi har tidigare sett ett annat exempel på detta: Den höga frekvensen av W
i norra Finland, i relation till omgivande landskap.

Figur 2-17. Frekvens av haplogrupp V (svart betyder >20%). Skåne har 43% (av 28 personer), samerna 40% (av 176 personer), följt av baskerna med knappt 11%, samt Portugal och Irland med dryga 7%. Skillnaden mellan samer och skåningar å ena sidan, och basker med flera å andra, är alltså mycket större än vad kartan antyder, eftersom gråskalan bara går till 20%.
Åldern på haplogrupp H har
uppskattats till 26 tusen år, och i Skandinavien erhölls samma ålder. Med andra
ord, ingen flaskhals förekom vid eller efter kolonisationen av Sverige vad
gäller den haplogruppen. Däremot kan åldern vara en skenbar effekt av en
befolkningskris orsakad av istidens maximum (den skenbara åldern bör bli ett
antal tusen år högre än då flaskhalsen inträffade, och den bör ha inträffat
någon gång under intervallet 25 — 15 kBP).
Endast två grupper i
Europa har högre frekvens V än H, nämligen skåningarna och samerna (Figur
2-17). Åldern på haplogrupp V har uppskattats till 14 tusen år på kontinenten,
men 19 tusen år i Skandinavien. Skillnaden antyder var V har uppstått, fast
andra har dragit slutsatsen att V är från Baskien. Frågan diskuteras ingående
senare i texten.
Haplogrupp JT delar sig i
J och T. Richards et al. (1996)[27] antog att haplogrupp J spreds till
Europa under den neolitiska revolutionen. Kartan visar att den är vanlig hos
beduiner (araber), se Figur 2-18.
Haplogrupp T är spridd
över i stort sett samma allmänna område som J, men den är ändå helt annorlunda
i detaljerna (Figur 2-19). Detta är ännu ett exempel på att om man slår ihop
data över för stora områden så tappar man information, och kartbilden blir
jämngrå.

Figur 2-18. Frekvens av haplogrupp J. Svart betyder >20%. Högst frekvens har uppmätts i Jemen (utanför kartbilden) med 28%, följt av beduiner (här placerade i Egypten, men deras hemland är nog Saudiarabien) med 21%. Därefter följer en rad områden med mellan 14 och 15%: Storbritannien, Skottland, Irland, Yttre Hebriderna, Island, södra Finland, Toscana, Bulgarien + Turkiet (på denna karta återger dock Bulgarien och Turkiet aggregerade data från andra studier, med lägre frekvens av J).

Figur 2-19. Frekvens av haplogrupp T. Svart betyder >20%. Egyptierna hade dryga 22%, medicinstudenterna i Göteborg knappa 22%, och azerierna kom trea med 17%. Skåningar och samer hade 0%, och ashkenazi-judar 1,3% (jämför Figur 2-21 nedan, över haplogrupp K). Notera hur vanlig T är i Frankrike-Italien, medan J är vanlig på de Brittiska Öarna. På samma sätt står de i kontrast mot varandra mellan egyptierna och beduinerna (araberna).
Man kan nog leda i bevis att utbredningen av haplogrupp J och T i Europa hänger ihop med jordbrukets spridning, på ett eller annat sät