东亚人类分布(上)
一.古代东亚直立人的消失 东亚地区在10万——6万前,经历了一次剧烈的冰川期,这一时期,原来繁盛的东亚古代直立人(如北京人、蓝田人)消失了。在距离今天10——6万年前,东亚地区没有发现确切的人类活动遗址。 二.6万年前到达东亚的第一批古亚洲人——D(Yap) 距离11万年前,第一批智人走出非洲东部,到达今天的中东地区,他们的Y染色体标志为M168,今天,非洲以外的所有的土著民族都是M168人群的后代。 此后,他们不断向周边迁徙,大约距离今天60000±5000年前,他们中的一支终于到达东亚地区,当他们离开非洲时,他们Y染色体SNP为DE原始型,到达东亚时,他们的Y染色体SNP的标志已经发展成为D——Yap,而留在非洲的DE原始型则发展成为E,成为60%以上非洲黑人的类型。 但当时的非洲人绝不是黑皮肤的,而是黄褐色皮肤的,D人群也绝对不是黑皮肤,可能也是黄褐色皮肤的。 (在距离今天1100年前,漆黑色皮肤的西非班图黑人只分布在占非洲20%面积的西非地区,在非洲东部、中部和南部,占非洲面积60%以上土地上生活的是狩猎的黄褐色皮肤的布须曼人Bushman,今天他们仍然有很多人生活在南非,看上去肤色并不太黑,Bushman人兼具黄白黑人种特征,而且其Y染色体是最古老的A,可能是最古老的人类族群,直到大约在1000年前,黑色皮肤的黑人才扩散岛非洲东部、中部和南部) 当时的D人群的皮肤很可能就是和Bushman人一样的黄褐色,而且向北的过程可能还变的更浅了。 (所以称呼D人群为矮黑人并不准确,称呼老亚洲人更准确。) D人群是最早到达了东亚的现代智人,但他们对现代东亚人的基因库genepool贡献并不大。 D人群独占东亚地区的时间不超过1万年(6—5万年前),大约在距离今天5万年前,另一支老亚洲人——C人群来了,C人群是大部分东亚人的母系远祖。 D类型在东亚人中很少见。 D分为四个主要支系,D1、D2、D3、D*。 D1分布主要在华南地区,是年代古老的支系,历史超过5万年。D1今天的分布,向南进入东南亚半岛,如缅甸、泰国、马来西亚,向西进入青藏高原,在藏族中比例非常高,向北进入蒙古草原,在蒙古族的比例比较少(2/147),在汉族地区相当罕见。 D2只分布在日本,韩国有非常少的比例该成分,日韩之外完全没有D2。D2的历史大致有3万年左右,在日本土著阿伊努人Ainu中出现频率很高。关于阿伊努人有两组数据:一个是2006年Hammer的数据是D2为75%,C3为25%,另一个2002年Tajima的数据D2为87.5%,C3为12.5%。 D3分布在西藏,而蒙古地区也有部分D3,可能来自藏族的迁徙。 D*是D最古老的支系,有6万年的历史。低频率分布在西藏,在印度洋上安达曼岛土著人中出现频率100%,马来半岛的土著人群中也有低频率分布。但绝不能因此认为东南亚矮黑人等同于D或D等同矮黑人。 汉族中也有一定比例的D,主要是D1,少量为D*。如于敏2002年的数据,福建汉族D1为1/80,无D*,如LuChuncheng在2007年的数据,800个汉族D的出现10例,频率为1.3%(10/800),Hammer的2006年的数据,168个汉族中出现一例D1,为0.6%,Xue的数据中,166个汉族出现3例D,为1.8%,复旦在2000年的一组数据为362汉族出现1个D,为0.3%,另一组复旦数据里北方1054个汉族有22个D(2.2%),南方652个汉族中为9((1.4%),马明义2007年的四川汉族一文中,341个汉族有3个D*,8个D1,频率共计3.2%,其他一些数据里,汉族都没有发现D,出现频率为零,如Karafet在2001年的数据,ToruKatoh的2004年数据。总体看,D在汉族很罕见,但在甘肃和四川比例超过3%,可能是古羌族的影响(现代羌族D为18.2%)。 苗瑶人群中有一定古老的D1,显示了这些民族非常古老。D1在是瑶族中不同瑶族支系出现频率差异非常大,如复旦2002的数据里一支系瑶族(勉)为50%,但复旦2003年另一支系瑶族数据为0,Hammer在2006年数据里瑶族为1.8%(60人里仅1例,同论文中苗族为8.6%,58人里5个),而Xue的数据,Bama瑶族里有D而Liannan瑶族则没有D,可见,各支系瑶族D出现频率很不同,除了个别支系,总体上D频率并不高。 藏族中D是是最常见的类型,如Hammer的一组2006年的数据,105个藏族,D*为4人(3.8%),D1为16人(15.2%),D3为32人(30.4%),没有D2,D共52人(49.4%),又如Karafet在2001年的数据,75个藏族人中25个D*(含D3),12个D1,D共37人(49.3%)。今天,D和O在藏族大致各占半壁江山,藏族年轻的成分O和汉族的O在类型上一致,O3人群在大致5000年前从华北给青藏高原带来了汉藏语,而古老的D的显示了藏民族在人种上有悠久的历史,D人群进入西藏可能有2~3万年左右的历史。和藏族关系密切的普米族D比例高达72.3%(34/47)。 日本人是东亚另一个高频率D的人群,在如Hammer2006年的数据中,259个日本人发现90个D2,占34.9%,没有其他D类型。不同地区日本人中,D的分布很不平衡,在京都东亚人类分布附近、九州岛、本州岛西部,是高比例的O而D少,而在北海道东亚人类分布、种子岛和冲绳东亚人类分布,D的比例则很高,显示了日本的最早的土著为D,后来为C,最后到达的是O人群,但O人群构成了当代日本大和族人的大部分主体父系成分,而日本土著阿伊努人则是D占80%以上,C占不到20%,没有O。 东亚其他人群D类型很少见,比如满族,在Karafet在2001年的数据里,复旦的2002年的数据,ToruKatoh的2004年数据里都没有发现D,Hammer在2006年的数据里满族也没有D,Han—JunJin的2003年的论文里44个满族里找到一个D,为2.3%,可以说满族人里D是相当罕见的。朝鲜人有一定比例的D,但比例不高,ToruKatoh的数据里延边朝鲜人D比例为2.5%(2/79),韩国人为3.5%(3/85),Han—JunJin的数据韩国人是2.5%(4/160),Hammer的数据韩国是4%(3/75),WookKim的数据是0%(0/216),Nonaka的数据是317个人里1个D1,12个D2,比例为4%。我国西北地区有一定的D,可能是古代羌族的遗留,如彝族人比较高,为16.3%(Hammer),现代四川羌族也比较高,为18.2%,西北**也比较高,11.4%(Xue),9.3%(Karafet),9.2%(杨亚军),但在2001年spencerwells的中亚东干族里却没有D,Zerjal的2002年中亚东干人数据里也没有D。总体上说,现代西北**的父系血统来源中,古羌族血统的影响是非常重要的来源。 D在东亚分布范围不大,在西伯利亚地区,当地北亚黄种人中并没有D类型,美洲印第安人中也没有D。 三.5万年前,C人群到达东亚,并构成现代一半以上东亚人的母系成分和黄种人体貌 D占据控制东亚的历史不超过1万年(距今6—5万年),在距今5万年前,C人群到达了东亚并控制了东亚。 早期的原始人渔猎生活,有三种主要的生活方式,一种是固定狩猎,一种是游动狩猎,另一种是就是海边食物采集。 固定狩猎的如尼安德特人(消亡了),游动狩猎的如克罗马农人(现在知道他们Y染色体属于I类型),而C人群,一般认为属于海边食物采集者。 海边食物采集者采集潮汐冲击到海岸上的海洋食物,每天都有固定的食物来源,他们可以一直沿着海岸快速移动,沿途都有稳定的高蛋白海洋食物,就这样,在5万年前他们迅速沿海岸线到达南亚、东南亚、东亚和澳大利亚。 C人群离开非洲时,还是原始的CF型,到达东亚时,已经变异成为新的C类型,而当时没有出非洲的CF原始型也在进化,后来发展成为F,后来又出现K,K在距离今天3万年前最终也进入了东亚。 C的最主要的几个支系为C*、C1、C2、C3、C4、C5。 C1只分布在日本地区的大和族人中(韩国也发现过一例),日本土著民族阿伊努人中主体是D2,少量C3,并无C1。日本人C1大致占5.4%,C3大致占3.1%(Hammer,2006年,259个样本),日本之外没有C1发现。 C2分布在印尼、巴布亚新几内亚等地,在印尼东部马来人中,C2占27.3%(Hammer,2006年,15/55人),新几内亚,86%(4/46),波利尼西亚人63.3%(37/60)。 C4、C5分布在南部印度人、斯里兰卡人和澳大利亚土著人中,超出黄种人的范围,不予以讨论。 C*是指除C1、C2、C3、C4、C5之外的C成分。 C*主要分布华南地区,如Hmamer数据中,瑶族为20%,土家为6.1%(另有C3为18.4%),苗族为1.7%(另C3为3.4%),马来亚为3.1%,印尼东部为5.5%(C2占27.3%),西部印尼为4.0%,维吾尔族为1.5%。C*可能主要分布在华南和东南亚地区,但实质上在华北地区也有很多。如XUE的数据里,如鄂温克为3.8%,赫哲族为6.7%,宁夏**为11.4%,乌鲁木齐维族为3.3%,伊犁维族为2.6%,Bama瑶族为17.2%。可以说C*在东亚分布也是很广的。 对东亚人而言,真正重要的成分是C3。 C3大致产生于距离今天4—3.5万年前的东亚,并扩散到北亚和北美州、南美洲。 在如此广阔的范围内,C3的支系十分众多。 C3*、C3a、C3b、C3c、C3d分布区域各不相同,这种格局可能在3万年前就已经具有了雏形。 C3a只分布在日本和韩国,和D2、C1、O2b,还有母系的M7a一样,都是具有日本韩国特征的特有类型。 C3b分布在北美州西北部地区,是当地土著印第安人的特征,占当地印第安人的9%。 C3c是极其具有阿尔泰语系标志性的类型,在西伯利亚南部达到峰值,并深刻影响了周边的其他阿尔泰语系民族。 在西伯利亚的南部地区,C3c是最重要的成分。如Pakendorf在2006年的数据中,中部埃文人50%,东部埃文人61.3%,中部通古斯人为40%,北部说突厥语的通古斯人为15.1%, Nyukzha通古斯人53.8%,Lengra通古斯人66.7%,Stony通古斯人70%,Okhotsk通古斯人为62.5%,Yenisey通古斯人为58.1%,可以说,在西伯利亚南部,尤其是通古斯人,C3c是最重要的成分。但在西伯利亚北部,N3则是最重要的成分,如雅库特人,N3占92.2%,而C3c才占1.1%,北部埃文人中,N3占90.9%,而C3c才占4.5,北极地区的爱斯基摩则以Q3和N3为主,没有C3c。在西伯利亚南部,N3的比例一般在20—40%之间,是南部西伯利亚通古斯人另一重要成分。 C3c在蒙古草原也有一定的分布,是蒙古语民族的标示性基因类型之一。如ToruKatoh的数据里,喀尔喀蒙古为15.3%(17/85),乌梁海蒙古为33.3%(20/60),Zakhchin蒙古为30%(18/60),Khoton蒙古为10%(4/40)。而Karafet在2001年的数据,149个外蒙古喀尔喀蒙古人,29个C3c,占18.1%。Xue的数据里内蒙古为8.9%(4/45),Zerjal在2002年的数据外蒙古人C3c为20%(13/65),spencer在2001年的数据里为45.8%(11/24)。Hammer的数据里,布里亚特人为4.9%(4/81),卫拉特人(阿尔泰)为5.1%(5/98),Pakendorf在2006年的数据,图瓦人(我国户籍登记为蒙古族),为9.1%(5/55),spencer在2001年的数据里图瓦人C3c为7.1%(3/42),IvanNasidze在2005年的数据,俄罗斯卡尔梅克人为37.4%(37/99)。综合看,核心的标准蒙古人一般有20%以上的C3c成分,其中内蒙古人最低,喀尔喀蒙古其次低,这两个群体低C3c主要是因为成吉思汗家族一簇的稀释和O3的高比例加入,内蒙蒙古人有最高比例的O3,超过了30%。外蒙古喀尔喀人也出人意外的有高比例O3,超过20%以上,而西部的图瓦人、Khoton人、卫拉特人、卡尔梅克人,O3都非常罕见,低于3%,甚至个别数据里根本没有O3,所以西部蒙古人可能原来本没有O3的,东部蒙古(喀尔喀—科尔沁—喀喇沁)则有高比例的O3,不同地区的蒙古人有不同的起源。
总体上看,突厥语各民族C3c并非主体成分。只有哈萨克族C3c特别高,如spencer在2001年的数据里57.4%(31/54),Zerjal在2002年的数据63.2%(24/38)。同样spencer的数据里,吉尔吉斯人为7.7%(4/52)卡拉卡尔帕克人为2.3%(1/44),7个地区共计326个乌兹别克人里一共4个C3c(只分布在其中2个人群,另5个人群无C3c)。中亚维吾尔人、土库曼人、喀山鞑靼人、克里米亚鞑靼人、阿塞拜疆人里没有C3c。Zerjal的数据里,中亚维吾尔人3.3%(1/33),吉尔吉斯人为12.2%(5/41),其他突厥语民族乌兹别克人、土库曼人、阿塞拜疆人没有C3c,Cengiz的2003年土耳其人数据,523个土耳其人只有5个C3和1个O3,其他都非东方草原血统。总体看,突厥语人中,哈萨克人与其他所有突厥人都明显不同,他们可以说与草原和西伯利亚南部边缘的蒙古人基因上非常接近,所不同的仅仅是他们讲突厥语而非蒙古语,吉尔吉斯人也有非常高比例的东方草原民族血统,尤其接近萨彦岭——阿尔泰山等地的土著游牧狩猎民族。其他突厥民族的主体成分来自中亚农业土著居民,与哈萨克、吉尔吉斯等草原游牧民族差异极其明显,而N3占92.2%的雅库特人与其他突厥语民族基本没有血统相似性,是被同化的地道的北极边缘的土著人。 C3c在我国东北其他阿尔泰语居民中也有一定分布,Hammer数据里,鄂温克为34.1%,鄂伦春为68.1%,辽宁满族没有C3c,Xue的数据里,鄂温克为26.9%、鄂伦春族为41.9%、赫哲族为11.1%、锡伯族为4.9%,岫岩满族为2.8%,达斡尔族为2.6%,ToruKatoh的数据辽宁满族为7.9%。总体上看,东北地区各阿尔泰语系民族父系远祖主体来自华北平原地区的东亚人群,受到西伯利亚居民的影响的主要是鄂伦春和鄂温克人,其他人都和南部西伯利亚边缘的通古斯人关系甚远。 C3c在阿尔泰语周边的汉、韩、日民族并不存在。如2001年spencer的北方汉族、韩国人中,2004年ToruKatoh的辽宁汉族、延边朝鲜人、韩国人、日本人,2006年Hammer数据的华北汉族、华南汉族、台湾汉族、韩国人、日本人、冲绳东亚人类分布人,2006年Xue数据里的哈尔滨汉族、伊犁汉族、兰州汉族、成都汉族、梅县汉族、延边朝鲜人、韩国人、日本人中,都没有发现任何一个C3c,所以可能情况是,C3c主要是随着阿尔泰语系的扩散而扩散的,周边的中、日、韩人里没有受到这种扩散的影响。 C3d是C3各支系中的另一个非常重要的支系,C3d主要分布在汉族、越南等民族中。 C3d在汉族中数量不高,但非常古老。实际上,整个C3家族,也是越向南越古老,STR多样性越高,显示了C3整体上是从华南地区向华北再向北亚扩散的。 C3d(C3*)在今天很多汉藏语民族中都有高比例分布,如Hammer数据中的土家族,为18.4%,如复旦数据的白族,为16.7%,汉藏语人的C3和北亚人的C3并不相同,相反,汉族、越南两族人的C3在STR上十分接近,同时和白族、土家族的C3d十分接近,有相同的起源,可见汉族和南方越民族的关系十分接近,独特的C3d显示了汉族等众多汉藏语民族共同的南方起源性质。 C人群对应的母系为M系(M*、M7、M8、M9、M10、C、D、G、Z)。今天,东亚人母系成分中,M对应了大致60%的成分,北方略多,南方略少。从常染色体角度上可以说,今天大部分东亚人都有一般以上古亚洲人的血统。 部分人尤其是一些网友推测,C人群,尤其是C3人群,外貌上已经完全是现代黄种人外貌。称呼“棕色人种”并不一定准确。是否确实如此,在没有论文数据情况下,我们不好定论。但我们要承认,C人群对现代东亚人基因库genepool的贡献并不逊色于N和O人群,唯独只是在Y染色体上略少一些而已。