在中国,汉族人口超过13亿,藏族人口约700万。前者主要聚居在东部平原、丘陵和低海拔流域,后者世代生活在青藏高原,平均海拔超过4000米。
从地理分布上看,这两个民族占据着完全不同的生存空间,语言不通,文化面貌也差异极大。
▲华北平原与青藏高原
但很多人都听说过一个词——“汉藏语系”。对于不太了解语言学的读者来说,这个概念多少有些反直觉:
汉语和藏语,一个属于东亚平原的农耕文明,一个属于雪域高原的游牧文明,无论怎么听都不像是“一家人”。既然差异这么大,为什么语言学家非要把它们归到一起?
那么,汉语和藏语真的拥有共同的祖先吗?汉族和藏族在遥远的过去,真的是同一群人吗?
汉族生活在东部平原,藏族生活在青藏高原,这两个区域之间几乎没有直接接壤。但在黄土高原和青藏高原的过渡地带,恰好存在一片特殊的地理单元——河湟地区。
▲河湟地区位置
河湟地区位于今天青海东部与甘肃南部的交界处。黄河在这里拐出了第一个大弯,湟水河从祁连山南麓奔流而下,两河交汇形成了若干河谷盆地。
这里的地貌兼具两种特征:谷地土壤肥沃,可以发展旱作农业;周围的山地和高原草甸,又适合放牧。它既不是纯粹的农耕区,也不是纯粹的牧区,而是农牧兼营的过渡地带。
▲河湟谷地
为什么恰恰是河湟地区,而不是其他地区,成为了后来汉藏语系人群的共同起点?这里有一个地理学上的关键因素:过渡带往往具有更强的文化创造力。
纯粹的农耕平原人口密度高但相对封闭,纯粹的游牧草原流动性强但难以积累文化成果。
而河湟这种农牧交汇带,既能承载一定规模的人口,又保持着对外交流和迁徙的弹性,最容易成为新文化和新语系的孵化器。
距今约5000年前后,河湟地区出现了以卡约文化、马家窑文化、齐家文化为代表的一系列考古学文化。
▲卡约文化
马家窑以精美的彩陶著称,齐家文化则出现了中国最早的铜器,标志着这一地区率先进入铜石并用时代。这些文化的共同特点,就是兼具农耕与畜牧双重经济形态,与当地的地理环境高度匹配。
▲马家窑文化
正是在这一时空范围内,语言学家和遗传学家找到了汉藏语系起源的关键证据。
2019年,一项发表在《自然》杂志上的跨学科研究,综合语言演化和古DNA数据,推算出原始汉藏语的分化时间约为5900年前,地点指向中国北方黄河流域,与马家窑、齐家文化的时空范围高度吻合。
这里需要解释一下语言学划分语系的基本方法。全世界现存的语言大致分属几十个语系,汉藏语系是其中之一。
语系划分的核心方法叫“历史比较法”:语言学家系统比较不同语言的基础词汇——数词、身体部位、亲属称谓、基本动词等——寻找它们之间成批量的、有规律可循的语音对应关系。比如上古汉语的“三”读作sum,古藏语也是sum,古缅甸语是sûm。
▲汉藏语系分支
这不是偶然相似,而是系统性的对应,说明它们继承自同一个祖语。语法层面的证据同样存在,上古汉语和古藏语都保留着通过声母清浊交替、前缀后缀来区分语法功能的痕迹,这些特征在现代语言中已大幅退化,但通过比较仍然可以重建出来。
汉藏语系包含两大分支:汉语族和藏缅语族。汉语族主要分布在东亚大陆,藏缅语族则涵盖藏语、缅甸语、彝语、羌语等数百种语言,使用人口分布在青藏高原、横断山区以及缅甸、尼泊尔、不丹、印度东北部等广阔区域。
▲汉藏语系的各个民族
也就是说,河湟地区的古代人群分化后,向东的一支演化为后来的汉语族祖先,向西南的一支演化为藏缅语族各群体的祖先。
缅甸语和藏语一样,同属藏缅语族,它们的祖先同样参与了这场向西南方向的大扩散。
▲汉藏语系分布
这里需要澄清一个常见的误解:语言同源不等于民族同源。那个生活在五千多年前河湟地区的古代人群,既不是汉人,也不是藏人,更不是缅甸人。他们只是说着原始汉藏语的一群先民。
后来的汉族、藏族、彝族、缅甸族等,都是在漫长的历史中,经由复杂的人群融合和文化演变逐步形成的。语言学的分类只是告诉我们,这些今天看起来差异极大的族群,在极为古老的年代拥有过共同的祖先语言。
河湟地区虽然在五千多年前孕育了汉藏语系的共同祖先,但它并非一个可以无限承载人口的地方。
河谷耕地的面积有限,随着人口增长,一部分人必须向外迁徙。地理条件决定了他们主要有三条出路:向东进入黄河中下游,向西南进入青藏高原腹地,以及向南沿横断山脉的河谷通道进入云南和东南亚。
▲人口迁徙
先看向东的路。离开河湟谷地后,地势逐渐降低,进入广袤的黄土高原,再往东则是黄河冲积形成的华北平原。
这一带土层深厚,河流密集,对于已经掌握粟作农业的人群来说,意味着更大的发展空间。东迁的先民沿着黄河流域扩散,与当地原有的仰韶文化后裔不断融合,人口规模迅速扩大,社会组织也日趋复杂。
到了公元前两千纪,黄河中下游出现了城墙、水井、青铜冶铸等文明要素。二里头文化(约公元前1900—前1500年)被许多学者认定为夏朝的都邑级遗址,此后的商朝(约公元前1600—前1046年)出现了甲骨文,西周(约公元前1046—前771年)建立了分封制度和礼乐文明。
▲二里头文化
经过春秋战国的整合,秦汉统一王朝最终奠定了汉族的核心文化框架。这条路走出来的文明,核心特征是定居农耕、中央集权和统一的文字系统。
▲向中原、青藏高原的迁徙方向
第二条路向西南延伸,通向青藏高原腹地。这是一条远比向东艰难的迁徙路线。海拔开始迅速抬升,空气含氧量逐步下降,适合耕种的土地越来越少。迁徙者沿着横断山脉北段的河谷逐步向西推进,最终进入青藏高原的核心区域。
这里平均海拔超过4000米,最大挑战不是缺少土地,而是缺氧。藏族人群之所以能在此世代生存,得益于一种叫做EPAS1的高原适应基因,这种基因很可能来源于已灭绝的丹尼索瓦人。
遗传学研究表明,藏族父系Y染色体与汉族高度共享,而母系线粒体DNA保留了大量高原古老印记,说明五六千年前带着黄河上游基因的男性移民分批进入高原,与当地女性不断融合,形成了藏族的先民。
高原可耕地极少,经济以放牧牦牛为主,社会长期维持部落联盟形式,直到公元7世纪松赞干布才统一各部,建立吐蕃帝国。
▲吐蕃帝国
第三条路向南,沿横断山脉的河谷通道南下。横断山脉的怒江、澜沧江、金沙江等大河南北纵贯,河谷海拔相对较低,气候温和,形成了天然的南北走廊。需要注意的是,这条南下路线与深入高原的路线在川西高原一带存在重叠。
川西(今四川阿坝、甘孜等地)是青藏高原的东部边缘,海拔比高原腹地低,属于高山峡谷地貌。
一部分藏缅语族人群在这一带停留下来,形成了后来的羌族、彝族、纳西族等族群的祖先,也构成了藏族康巴支系的重要组成部分。而另一部分人继续沿河谷南下,进入云南西部,其中走得最远的是缅族先民。
▲向东南亚的迁徙方向
他们属于藏缅语族中的缅彝语支,大约在公元前一千纪到公元初年沿横断山脉河谷南迁至云南西部山地,随后继续向西南方向移动,在公元7至9世纪陆续进入今天缅甸的伊洛瓦底江流域,并于11世纪中期建立蒲甘王朝。
▲蒲甘王朝
与缅族先民路线相近的还有彝语支各族的祖先,他们散布在云南、四川南部的广大山区,形成了彝语、傈僳语、拉祜语等数十种语言。
同出一个河湟谷地,三条路走出了三个不同的结果。东亚大陆上的汉族先民在公元前3世纪就由秦朝完成了统一,汉朝巩固了大一统格局。
高原上的藏族先民则到公元7世纪才由松赞干布统一各部,建立吐蕃。
南下的缅族先民进入文明统一国家的时间更晚,直到公元11世纪蒲甘王朝兴起,缅人才在伊洛瓦底江流域建立起自己的统一政权。
很多人听到“汉藏语系”这个名字,会想当然地以为汉语和藏语一定很接近。实际上,现代汉语和现代藏语听起来完全不相似。
▲汉语藏语打招呼
这就涉及一个根本问题:语言学所说的“语系”,到底是什么意思?
要理解汉藏语系,最好先看看全世界语言的分类格局。目前全球现存约七千种语言,语言学家将它们归入了几十个语系。其中规模最大的三个语系,每一个都比汉藏语系更加“夸张”。
▲世界语系分布
全球第一大语系是印欧语系,涵盖从欧洲到南亚的四百多种语言,使用人口超过三十亿。这个语系包括了英语、法语、德语、俄语、西班牙语,也包括印度的印地语、乌尔都语,以及伊朗的波斯语。
一个英国人和一个印度人站在一起,外表不同,文化不同,说的话听起来毫无相似之处——但语言学家告诉你,英语和印地语属于同一个语系。
▲印度与英国女性
更令人惊讶的是,这些语言确实有共同的源头。根据学界主流的“坟冢假说”,原始印欧语的使用者大约生活在距今六千到五千年前的东欧大草原——今天乌克兰和俄罗斯南部一带。
他们是游牧人群,驯化了马,发明了轮车。大约从距今五千年前开始,这批人一波一波地向外迁徙:向西进入欧洲,演化为凯尔特人、日耳曼人、斯拉夫人的祖先;向南进入伊朗高原和印度次大陆,演化为波斯人和印度雅利安人的祖先。
今天英语里的“father”(父亲)、拉丁语的“pater”、梵语的“pitṛ”、波斯语的“pedar”,发音相似并非巧合,它们都继承自原始印欧语的同一个词根。这种跨越欧亚大陆的亲缘关系,比汉语和藏语之间的关系更加遥远,但同样被语言学家认定为同一个语系。
▲各种印欧语中的“星期六”
全球第二大语系是汉藏语系,包含汉语和藏缅语族共约四百多种语言,使用人口超过十四亿。全球第三大语系是尼日尔-刚果语系,主要分布在撒哈拉以南非洲,涵盖斯瓦希里语、约鲁巴语、祖鲁语等上千种语言,使用人口超过六亿。
▲非洲的语系分布
此外,还有南岛语系(从台湾到夏威夷到马达加斯加)、达罗毗荼语系(印度南部)、亚非语系(阿拉伯语、希伯来语所属)等众多语系。
每一个语系内部的语言差异,都远远大于一般人想象中“亲属语言”应该有的相似程度。
明白了这个背景,再回头看汉藏语系,就不会觉得奇怪了。语言学家划分语系,依据的从来不是表面的听感,而是深层的历史来源和语言特征。
这个判断方法叫“历史比较法”,核心就是寻找“同源词”——不是偶然相似的几个词,而是成批量的、有规律可循的语音对应。
举个通俗的例子。汉语数字“三”,上古时期读作sum,古藏语也是sum,古缅甸语是sûm。汉语的“我”,上古音读作nga,藏语至今仍是nga,缅甸语是nga。汉语的“鱼”,上古音读作nga,藏语是nya,缅甸语是nga。
▲汉语与藏语的“3”
这些词都属于人类语言中最稳定的核心词汇——数字、身体部位、人称代词、基本自然物——它们极少被借用。如此成批量的对应,只能说明这些语言继承自同一个祖语。
语法层面的证据同样存在。上古汉语和古藏语都保留着通过声母清浊交替来区分词义的痕迹。比如上古汉语中“见”读作kens(清声母),表示主动去看;“现”读作gens(浊声母),表示被动出现。
这种“一个词通过声母清浊变一下来表示不同语法功能”的机制,在古藏语中更加发达和系统化。这不是谁学了谁,而是它们共同继承自原始汉藏语的一套古老规则。
当然,六千年的分化足够让同源语言变得面目全非。汉语走上了“分析化”的道路:词形基本不变,语法靠语序和虚词来表达。
▲汉语不同时期的“2”
比如“我吃饭”和“饭吃我”,全靠顺序决定谁是主语。
藏语则保留了大量“形态变化”:动词会根据主语的人称、动作的时态发生词形变化。
▲英语中的形态变化
比如“我去”和“你去”,藏语里两个“去”的写法可能不一样——这一特征在安多藏语方言中至今保存完好,被语言学家视为原始汉藏语的活化石。
语言的分化,只是文明分化的一个缩影。汉族社会几千年来围绕着儒家思想构建,重视家族伦理和现世秩序,在平原上发展出郡县制、科举制等庞大而精密的社会治理体系。
藏族社会则在高原上走出了一条完全不同的道路,藏传佛教与本土苯教融合后成为文化核心,寺庙不仅是宗教场所,也是文化中心和权力中心。这两个文明的外在面貌截然不同,但它们各自使用的语言,在六千年前却是同一种语言。
这就是汉藏语系这个概念最大的意义。它不是为了拉关系、套近乎,也不是说汉族和藏族是“一家人”。
▲汉藏一家亲
它只是冷静地告诉我们一个事实:今天差异如此之大的语言和文明,在极为古老的年代,曾经有过一个共同的起点。
而那个起点,就在黄河上游的河湟谷地。如果再看得远一点,缅甸的缅族、云南的彝族、四川的羌族,他们的祖先也都参与了那场从河湟谷地出发的大迁徙。一个五千多年前的古代人群,最终塑造了东亚和东南亚大陆上近半数国家的语言版图。