全球性别差距报告中国排名103?那是数据错了!

全球性别差距报告中国排名103?那是数据错了!

前些天在知乎看到了 @Yiqin Fu 的这篇文章:

Yiqin Fu:【数据分析】中国女性地位真的是世界倒数吗?zhuanlan.zhihu.com图标

主要分析了2017年全球型别差距报告中中国地位的情况,里面的主要观点认为中国之所以位列100,是因为指标选取的不合理,“数据的选择,以及把各项数据综合起来得到“性别平等指数”的过程却是主观的。”,并以此展开了精彩的分析。

今年这个情况并没有得到改善,2018年我国的性别公平排名再跌3位,变成了103

真的是我国男女平等的情况相对于世界恶化了么?还是如Yiqin所说,是指标选取不合理么?

可能都不是,真实的情况更加弱鸡一些,可能就是他们数据搞错了。

我一个在国际机构工作过的校友对于这个报告里面的一些内容进行了展开解读:

全球性别差异报告把中国的教育数据算错了,一错错了三年!mp.weixin.qq.com图标

昨日获得授权后,我选取部分重要结论呈现如下:

这是经济报告中中国的数据情况:

感谢女权组织橙雨伞的转译

我们可以看到,这边的国家分值卡分为了四类:

1.参与经济事务和就业机会(Economic participation andopportunity);

2.接受教育(Educationalattainment);

3. 健康与生存(Healthand survival);

4. 政治赋权/女性的政治势力(Political empowerment)

其中因为1我没有直接数据,对于4Yiqin已经做过深入分析在此就不做赘述,仅对2和3里面涉及的数据进行分析。

在2. 接受教育这个大栏目下有四个小指标,分别是识字率,小学净入学率,中学的净入学率,高等教育的总入学率。其数据来源是联合国教科文组织统计所(UIS),是2018年10月截取的数据。

那么我们从识字率说起,识字率指标有多种推算方法,根据@Chenghao Liu 的推测,经济论坛所采用是:15岁以上成年人口的识字率(可理解为:该国识字的女性/所有该国女性;该国识字的男性/所有该国男性),其所验证的几个国家的识字率数据都来自这一变量(变量名一致),且都是最新的数据(男女数据在同一年)。

但是神奇的地方在于,这个“最新”其实并不一致

乍得和哥伦比亚用的是2016年的数据。
中国用的是2010年的数据。
美国,没有数据……
(最下面一行数据为美国,其数据为空白)

这时候,神奇的地方来了

美国没有数据怎么办呢?我猜大概制表人大腿一拍,老牌发达国家,那就99%吧……于是美国的就有了99%的识字率……

请注意紫色内容

注意:统一采用的数据库中没有美国的数据,99%这个“数据”来源不明!!!

然后经过比对,至少加拿大(55页),法国(101页),英国(285页),美国(287页)在UIS都没有数据的情况下,他们的男女识字率都被默认为99%…且UIS系统内完全没有这些国家1970年到2018年的识字率数据。

换言之,这个项目上这个几个国家的满分是白送的,一送送了好几年。

而中国则在用2010年的数据和人家2016年甚至更新的数据在做比较。

臆测数据对于统计人员来说已经是不可饶恕了,但报告中还有更加令人窒息的情况。

请注意标黄的一栏,是中学入学率

世界经济论坛的数据显示,中国的女生中学毛入学率仅为47.1%,男生为52.9%。

初中不是九年义务教育吗???

九年义务教育!!!

喂狗吃了么!!!

女生入学率才47.1%!!!

but,桥多麻袋!

47.1%+52.9% = 100%

emmm

莫非世界经济论坛可能是混用了某个比例……

经过@Chenghao Liu 查找,果然发现了,他们就是在瞎用的替代数据

“神奇”的替代指标

世界经济论坛使用的替代指标为:Percentageof students in secondary education who are female,即女学生占中学学生的比例……

但是基数不一样吧……我们不妨举一个极端例子,某地适龄入学女生有10人,而适龄入学男生有100人,女生毛入学率为100%,而男性则为10%,结果按照经济论坛的做法男女生毛入学率各为50%……

经济论坛的做法不但严重拉低了毛入学率而且会带来三个问题:

1. 在没有注明的情况下偷换变量,使得国家间的比较变得无意义;
2. 新生儿比例的男女诧异已经在“健康与生存”一节中计分了,如果只对中国采用此变量,便是双重扣分;(这个数据也有很大问题,稍后展开)
3. 这一替代的变量无法符合原本考察男女教育机会是否均等的本意,没有替换的理由。

在这一项上,中国实际上是可以得到满分的,因为根据UIS最近的2013年的数据,当年中国女生总入学率为95.03%,男生总入学率为94.23%,女生领先。

PS:中学净入学率的变量替换法,最早可以追溯到2016年报告,已经用了三年了

说完了教育部分,来说说健康部分。

且不说这两个指标能不能表现出中国女性健康平等的问题,光是数据本身就是错的。

首先新生儿性别比,表中中国的数据是0.87,这个数据是错的。

在开放二胎后,中国型别比的问题实际上是下降了的。

网上能查到的最新的数据是112.88名男婴/每100名女婴,这是2016年1月1日的数据,2017年数据尚未查证到,这个数据约等于0.89而不是表中的0.87。

如果说这个数据还有讨论余地的话,那健康寿命预期也不对。(之前我看错成预期寿命了,经评论提醒已经修改)


这个数据也不是2018年的数据,而是WHO的2016年统计数据,不过这个也可以理解,毕竟这个不是年年调查的,比之前的入学内容已经靠谱多了。

http://apps.who.int/gho/data/view.main.HALEXv?lang=enapps.who.int

Healthy life expectancy (HALE)

Healthy life expectancy (HALE)apps.who.int

女权在知乎甚至是中国互联网都是个敏感话题,面临各种各样的污名化或者不理解。但这并不是本文讨论的重点,仅想借此文来破解“国际权威机构”的迷信,外国的调查机构和数据甚至排名不见得真的更加符合实际,中国女性的地位近年来究竟是提高还是降低了,这个问题在这份报告中并没有得到解答,103名这个国际排名应该也绝不是中国女性地位在国际中的真正排名。


欢迎讨论。

编辑于 2018-12-21

文章被以下专栏收录