财新传媒
位置:博客 > 寇宗来 > 所有通不过“伽利略检验”的大学排行榜,都是耍流氓!

所有通不过“伽利略检验”的大学排行榜,都是耍流氓!

提要

中国许多大学排行榜的问题是重总量不关心人均,重数量不重视质量。由此,两个学校合并,导致质量排名靠前,背后的逻辑,与亚斯里斯多德“重的物体落得更快”的理论并无二致。

在亚氏理论早已经被“伽利略检验”所证伪的今天,仍有此类排行榜大行其道,既不悲哉?!

任何只公布结果却不公开数据或算法,且又通不过“伽利略检验”的大学排行榜,实际上都是耍流氓。

最近,国内许多机构又开始发布中国大学排行榜。发布排行榜本身没有问题,实际上,只要方法科学,公开可靠,这些排行榜反而可以作为权威排行榜的补充,有助于社会从多角度理解中国各大学的相对优势。

但可惜的是,与教育部的权威排名相比,这些排行榜不但数据和方法不透明,结果也与人们日常观感差别很大。有差异不一定有问题,但差异很大,却没有过硬证据,就难以服人。

这里特别需要聊一下武氏大学排行榜。此排行榜素以“雷人”著名,受到社会广泛质疑,涉嫌“收钱”等【1】。是否收钱,需要证据,这个不好说,我也没兴趣。

我主要关注的是排行榜算法的科学性和数据的可靠性。关于数据可靠性,反正人家没公布,也不知道里面到底是什么,不用讲。现在单讨论算法的科学性。

这些大学排行榜,指标构造方法基本上是这样的,把ABCDEFG等多个维度指标,无量纲化之后,再按照某个“合理”的权重加在一起,形成一个总量指标,最后再根据这个总量指标对各个大学进行排名。

这种构造方法,一个很大的问题是“重复计算”。举例说,将“投入指标”和“产出指标”加在一起,这时人们不禁纳闷,难道产出不是投入导致的?既然算了投入,为什么要算产出;反过来,既然算了投入,为什么还要算投入?

这种构造方法,一个很玄妙的地方是“巧立权重”。为说明问题,做个简化。不妨考虑比较两所大学U1和U2;有两个指标,A和B,都是正的。

假设两个指标的权重分别a>0和b>0,则大学U1得分为a*A1+b*B1,大学U2得分为a*A2+b*B2。除非大学U1在两个指标上都比U2好(即A1>A2,B1>B2),则总是可以找到“合适”的权重a和b,使得一所大学的总得分高于另一所大学。

比方说,假设A1>A2但B1< p="">

但是,要让a远远大于b,或者b远远大于a,尤其是与以前的权重不一样,人们肯定会表示质疑。面对猜疑,最好的办法是公开算法和数据。但反过来说,为什么不这么做,就很令人怀疑里面的科学性和公正性。

我猜想,这或许就是发布排行榜的人,只发布排行结果,但不发布排行数据甚至排行算法的原因吧。

很多年前,武同志发布了他的大学排行榜,引起了人们的普遍质疑(不管怎么样,对他持之以恒的态度表示钦佩)。当时的热点问题是学校合并对学校排名的影响,尤其是浙江大学与南京大学之间的比较。

对此,武同志的回答非常“精彩”。大致意思是,尽管南京大学和东南大学都排在浙江大学后面,但如果南京大学和东南大学合并,则合并之后的学校(不知道是称为南东大学还是南南大学?),排名就可以和浙江大学相仿。

何等奇怪的逻辑!

之所以奇怪,是因为通不过“伽利略检验”。大家都知道,伽利略是中世纪著名的物理学家,推翻了统治人类千年的亚里斯多德理论。亚里斯多德是超级伟大的学者,是许多学科的奠基人,但也犯了不少错误。其中一个错误理论就是“重的物体比轻的物体落得快”。这个错误理论实际上是很符合常识的,因为石头的确比鸡毛落得快。

面对亚氏理论,伽利略发现了其中的逻辑矛盾。他设计了一个思想实验。假设有一个大石头(S1),一个小石头(S2),再用一根“没有质量”的绳子把他们绑在一起形成一个巨型石头(S3)。

这样,按照亚氏理论,大石头S1比小石头S2落得快,进而根据平均律,两个石头绑在一起,比如是小石头S2拉了大石头S1的后腿,因而巨石头S3必然比大石头S1落得慢。但是,既然S3是S1和S2“绑在”一起的,重量更大,所以,根据亚氏理论,S3又应该比S1落得快。自相矛盾了!不妨将伽利略的思想实验称为“伽利略检验”。

在逻辑上证明了亚氏理论错误之后,伽利略又进行了著名的比萨斜塔实验,经验上证伪了亚氏理论。实际上,根据“自由落体定律”,不论轻的还是重的物体,本来落得都应该一样快,而石头之所以落得比鸡毛快,是因为空气阻力问题。

再回到武氏大学排行榜。很容易发现,南京大学和东南大学就恰好似前面提到的两个石头S1和S2,如果合并则形成石头S3。在武书连同志看来,S3比S1或者S2都好,这个逻辑和亚氏理论的逻辑完全一样。

对武氏排行榜唯一可能的辩护是,两个学校合并会产生巨大的协调效应(synergy effect),即1+1>2。但根据笔者多年观察,两个本来没啥关联的学校合并,不产生1+1<2的内耗效应,已经算是非常成功了。由此可见,武氏排行榜无法通过“伽利略检验”。

伽利略检验只是一个逻辑检验。大家都知道,通过逻辑检验,不一定为真,但通不过逻辑检验,一定为假。

欧洲早已经由启蒙走出中世纪的黑暗,物理学也早已从牛顿力学走向更加普适的相对论和量子力学,但在落实“创新驱动”战略的当代中国,居然仍然有如此之多通不过“伽利略检验”各色排行榜,仅看总量、数量,不讲质量、人均,岂不悲哉?!

一句话,所有通不过伽利略检验的“质量”排行榜,都是耍流氓。

【1】http://edu.sina.com.cn/blog/focus/phbqgz/index.html

*************************************

中国城市和产业创新数据下载:

数据和报告下载链接:

https://pan.baidu.com/s/1qZydmzU

密码:vgk5

推荐 2