在我国,提到文化差异,人们往往首先想到的是南北差异:“南甜北咸”的饮食偏好、“南船北马”的交通方式、“南柔北刚”的性情印象,甚至方言、戏曲、建筑风格等也常被置于南北对比的框架中加以理解。更有甚者Talhem (2014)等学者提出一个引人关注但不乏争议的假说:认为“南稻北麦”的农业传统,在深层次上塑造了中国人的文化心理与行为模式。
而提到社会经济发展水平,人们则更多聚焦于东西差异。东部沿海地区凭借区位优势和政策支持,在经济开放、产业现代化、城市化水平和国际融合等方面显著领先;而西部内陆地区则受制于地理条件、历史基础等因素,发展相对滞后,这种区域不平衡成为当代中国发展格局中的一个核心特征。
生育意愿
那么这种地理差异是否同样反映在人口行为紧密相关指标上?
毕竟任何人口学行为都是文化和社会经济因素的共同作用的结果。
我们最近使用小区域估计方法结合调查数据和普查数据,估计了中国县级的理想子女数和意愿子女数,结果同样显示出南北分化(理想子女数)与东西差异(意愿子女数)并存的鲜明态势。
图1 理想子女数(左)与意愿子女数(右)的空间分布
要理解生育意愿不同指标的空间分布,首先需要厘清“理想子女数”和“意愿子女数”在概念上的差异。二者虽然密切相关,但所反映的内涵并不完全相同。
理想子女数通常通过提问被访者“你认为一个家庭有几个孩子最理想?”来测量,而意愿子女数的常见提问方式是“你自己想生几个孩子?”。
正如郑真真等学者指出:理想子女数更多体现的是一种“向后看”的总结思维方式,反映个体在既定文化规范和社会期待下,不考虑现实约束因素的生育数量认知;相比之下,意愿子女数是一种“向前看”的思维方式,更侧重于个体在未来生命周期中“实际计划”生育的数量,因而更容易受到经济现实、政策环境以及个人条件的约束。
因此理想子女数均值较高,方差较小,且在空间上更稳定地呈现文化区域特征,而意愿子女数的均值较低,方差较大,且其的空间分布可能与社会经济梯度更为一致。
图2:理想子女数(左)和意愿子女数(右)在分层回归后数据交叉单元(年龄组县)估计的分布
如何利用有限数据估算小区域公众态度
想搞清楚不同地方的人在“生孩子”这件事上细微的态度差异,并不是一件容易的事。这要求我们的数据必须能精细到县、甚至更小的地理尺度。然而,目前大多数相关问卷调查的设计目标都是保证全国或省级层面的代表性,无法代表这些微观区域的具体情况,就像一张比例尺太大的地图,看不清局部的细节。
基于2017年全国生育状况抽样调查,结合人口普查数据分县的育龄妇女年龄结构 ,我们使用了Gelman 等学者(2017)提出的分层回归模型且事后加权(multilevel regression and post-stratification,MRP)的方法,将不具有县级代表性的生育意愿数据变得具有县级代表性。
首先建立一个分层回归模型,用被访个体所属地年龄组、县、地级、以及省等作为不同层级的随机效应来预测个体的生育意愿。对于样本量很少甚至没有样本的县,模型不会孤立地看待它们,而是会通过“部分池化” (partial pooling)向整体平均水平“收缩”,从而得到一个更稳定、合理的估计。
在分层回归中,学者通常重点关注固定效应;而随机效应的收缩特性,实则是一种重要的估计技术。该技术假设所有观测单位属于某一“共同体”(如相同年龄组、县、地市或省份),借助数据充分群体的信息来校正数据稀疏群体的估计,从而提高推断的稳定性与可靠性。
模型的输出是每个独特的人口亚群(如“A县的、25-29岁女性”)的生育意愿预测值。有了每个亚群的预测值,但直接平均这些预测值不能代表整个县,因为样本中各类人群的比例和现实中的比例可能差异很大。为此,我们引入人口普查数据,获取各县育龄妇女的真实年龄构成,以此作为加权依据,将各亚群的预测值进行加权合并,从而得到符合实际人口结构的县级生育意愿估计。
除了空间分异,我们的研究也揭示了在空间研究中地理尺度的重要性。结果表明,理想子女数与意愿子女数的省内差异与省际差异幅度相当。这意味着,影响生育意愿的关键因素可能作用于更微观的地理或社会尺度。
因此,我们的研究不仅描绘了生育意愿的详细地理分布图,更提供了一种理解中国社会差异的维度。它告诉我们,像“生育意愿”这样一个看似简单的指标,当被置于“文化”与“经济”、“理想”与“现实”、“南方与北方”和“东部与西部”的多维透镜下观察时,会呈现出极其丰富且层次分明的图景。这或许能改变我们看待数据的方式:就像石墨和钻石,虽由同种元素构成,却因内部结构的细微差异而展现出截然不同的形态与性质。
本文来自微信公众号:严肃的人口学八卦,作者:作者:王东晖,责编:李婷
上一篇:微软广告,终于找到了接盘侠
下一篇:宗馥莉,放下了