出生性别比的最新数据

少于 1 分钟阅读时长

发布时间:

性别比已经是男女权争论的经典议题了,然而争论了半天,发现大家都在使用各种奇奇怪怪的不知来源老数据。本文将会基于国家统计局的公开发布的数据进行详解。在生物学上,自然状态下的出生性别比并非1:1,而是约为105(即每100名女婴对应105名男婴),正常范围在103至107之间,这是因为男性在生命历程中的死亡率高于女性,自然进化使得出生时男婴略多,以维持成年后性别比的平衡。

出生性别比

事实上,最新数据我们完全可以在国家统计局政府信息公开里面查询到。如下图,最新的结果是2022年10月10日的结果

image

▲国家统计局政务信息公开搜索得出的结果

在该国家统计局发布的文章中指出:

从出生人口性别结构看,2021年出生人口性别比为108.3,比2012年降低9.4,出生人口性别结构改善明显。1

再来看2020年第七次人口普查的数据:

2020年人口普查年鉴中,0岁性别比是111.222

低年龄组性别比

0岁性别比目前国家统计局不会每年都公开相关数据,然而国家统计局会在每一年的中国统计年鉴中公布0-4岁低年龄组的数据。

image

▲数据截图

最终结果如下:

年份0-4岁年龄组性别比
2024109.143
2023109.284
2022109.885
2021110.376
2020110.987
2015116.238

我们可以发现从2022年开始,我国低年龄组性别比就已经低于110,且逐年走低。

常见误区

我国自古性别比失衡?

1950年代和1980年代,中国的出生性别比处于正常范围。以下是各个人口普查的出生性别比数据9,1990年我国性别比开始失衡。

年份出生性别比
1953104.88
1964103.83
1982107.63
1990114.18
2000117.79
2010117.90
2020111.22

北京三胎性别比260?

这个数据来源于北京市第六次人口普查,表中第三胎性别比是260。

然而,当我们回归数据本身,会发现这个令人咋舌的数字背后,隐藏着一个统计学上极为基础的问题——样本量太小。

image

▲北京市第七次人口普查

答案藏在表格中一个很容易被忽略的细节里。如果你仔细看那个表格,在“第三胎”栏目的旁边,有一列标注为“小计”——它表示的是该组别的出生人口总数。北京三胎的“小计”是多少?144人

144人的样本意味着什么?让我们做一个简单的计算:

如果这144人中,男孩数增加1个,性别比就会发生显著波动。如果男婴少1个(变成103),女婴多1个(变成41),性别比就会变为251,如果男婴多1个(变成105),女婴少1个(变成39),性别比就会变为105÷39×100≈269。

在144人的小样本中,每1个婴儿的性别变动,就能让性别比上下浮动近10个点。 这意味着260这个数字本身就具有极大的统计不确定性——它完全可能只是样本量太少导致波动产生的偶然结果。

事实上,统计学研究早已指出:规模比较小的样本(出生人口少于3000人),不宜单独计算出生性别比。

因此,如果仅以正态分布为理论基础作为分析、监测人口出生性别比变动趋势主要方法的话,将面临出生婴儿规模小于3000 人(如县级及以下区域单元)不适用的问题。10

北京三胎144人的样本,远远低于3000人的安全阈值,用它来计算性别比并得出“北京三胎性别比260”的结论,从统计学角度看是极不严谨的。

综上所述,北京三胎性别比260这一数据虽然「确实存在于普查表格中」,但它在统计学上几乎没有任何实际意义。用144人的小样本来计算性别比,就像用抛10次硬币的结果来推断硬币的正反面概率一样——偶然性太大,结论不可靠。

(以下内容2026年4月12日19:00更新)

五胎性别比的数据可靠吗?

答案是:也不可靠

有人向我投稿了这样的一份表格,我们先观察一下这个表,最低的出生性别比20多,最高的到130多去了,这合理吗

首先我们需要回顾一点大家曾经都学过的的统计学知识

第一步,将这个表格第五胎的平均值,得出结果是

\[\bar{x}≈123\]

第二步,计算其样本标准差 ,得到

\[\sigma = 51.07\]

然后计算标准误,其中 n=31(31指的是31个省、直辖市以及自治区),那么计算可得

\[\sigma_{\bar{x}}=\frac{\sigma}{\sqrt{n}} =\frac{51.07}{5.57} ≈9.17\]

也就是说,如果反复从全国随机抽取 31 个省份来算均值,每次算出的结果会在真实均值上下 ±9.17 的范围内波动。我们在95%的置信区间内,计算可得:

\[(\bar{x}±1.96)\sigma_{\bar{x}}=123.81 ± 1.96 × 9.17 ≈ 105.8 ~ 141.8\]

即我们有 95% 的把握认为,全国第五孩的真实性别比落在这个区间内。

这个误差已经不小了,总的来说没啥参考意义。

参考和注释

  1. 国家统计局政府信息公开 

  2. 第七次人口普查年鉴:表3-1 

  3. 中国统计年鉴2025 

  4. 中国统计年鉴2024 

  5. 中国统计年鉴2023 

  6. 中国统计年鉴2022 

  7. 中国统计年鉴2021 

  8. 中国统计年鉴2016 

  9. 李智,张珊珊,等.1953-2010年中国出生人口性别比变化趋势及地理分布[J].中国生育健康杂志.2016.27(1):13-18 

  10. 王广州.人口出生性别比变动的监测方法研究[J].中国人口科学,2010,(04):2-12+111.