科学大家|投票、选举、排名,有靠谱的方法吗

科学大家|投票、选举、排名,有靠谱的方法吗
2018年09月27日 10:22 科学大家

  出品 | 新浪科技《科学大家》

  撰文 | 夏志宏 南方科技大学讲座教授、数学系主任,美国西北大学终身教授

  我是一名数学家,有时候也有人称我为天文学家,但是我现在讲的跟数学、天文关系都没太大关系,严格来说这应该是经济学的一个范畴:选举理论。

  其实选举跟排名都是同一个范畴里面的,都是经济学里面的社会选择问题,在经济学里面有很多这方面的研究,也有很多经济学的诺贝尔奖是给了这个方向。

  我们该相信选举吗

  上图是美国现任总统特朗普跟希拉里,在竞选时的辩论图片。现在我们知道特朗普当了总统,但其实他得的选票比希拉里低了很多,至少有两百万票;2000年美国大选时,小布什当上了总统,当初跟他竞选的是民主党的Gore,Gore得票的整个人数是48.4%票,小布什得的是47.9%票,但小布什却赢得了大选。

  这里面主要的原因是选举制度的问题,美国的选举制度不是看多少人投你的票,而是看选举团有多少选举人投票,看你得多少个州。大部分州是这样的,如果你得了这个州的大部分票,那么这个州的票将会全部给你。

  那么他们选举人的票得了多少呢?Gore得了266票,小布什得了271票,尽管他这个271票是超过了Gore,但是他得271票,到最后是因为美国的佛罗里达州,这个州到最后很长时间有争议,最后重新数票,数票以后发现小布什比Gore在这个州只多了500票左右,这500票还是有争议的。这个州当初有一个人参选,参选的第三个人是Ralph.Nader,Nader在这个州得了97000张票,而97000张票基本上从民主党那里拿来的,就是Nader当初的主要的票源是民主党的票。所以从这个角度来讲,他假如不参选的话,佛罗里达所有的票就会全部给Gore,这样的话Gore的票远远超过了小布什的票,所以这也是一个非常不幸的例子,小布什最后当上了总统。

  这个是美国1860年大选,林肯是美国历史上最伟大的总统,当初北方都希望林肯当上总统,南方都希望其他人当上总统,最有名的候选人是道格拉斯,现在历史上最著名的总统辩论便是林肯跟道格拉斯辩论。

  当初整个南方都反对林肯当总统,所以林肯根本就没到南方去竞选,不仅南方,还有其他地方的票也基本上拿不到。但是很幸运的是,反对林肯的人有三个候选人,这三个候选人基本上把票给分了,所以到最后,林肯当上了总统。随后南方宣布独立,美国发生内战,战后又统一。

  所以整个选举,到最后影响了历史,人类的历史很多时候就是因为一个简单的选举方法的不同,影响了整个人类历史的发展。

  在体育比赛里面,很多时候它的名次,尤其在花样滑冰的时候,它的名次不是仅仅由得分来决定谁是冠亚军,而是在花样滑冰里面除了得分以外还有名次,它是一个非常复杂的公式,这个公式有时候就会发生很有趣的现象。

  在1995年世锦赛滑冰的时候,上图中三个人在Kwan没有滑之前,她们三个人排名是陈露第一, Kobek第二, Bonaly第三。结果Michelle Kwan,Michelle Kwan的实力不如其他三个人,所以她基本上不会拿到奖牌,结果她滑了一下以后,因为她的加入,使得最后这三个人,第二名和第三名两个名次就换了一下。比较荒唐的在什么地方呢?她们三个,一二三名已经都滑好了,而且名次都定好了,到最后第四个人,跟她们没有关系的,她滑了以后改变了以前的名次。这个算是一个投票或者算一个选举的方法,所带来的一些比较自相矛盾的问题。

  结论是什么呢?有时候选举的方式决定了选举的结果,而不是所谓的人民的意愿。有时候经常会发生的,你是什么样的选举方式,你就有什么样的结果,换一个方式就换一个结果,这个在历史上很多很多时候都发生过。

  选举有很多不同的方式,比方在美国投票一次,这一次谁得票最多,这个州就是谁胜。而在欧洲就不一样,比方说法国、英国这些地方,尤其法国,假如三个候选人投票以后,投票最高的候选人会再投票一次,这是一个不同的选举方式。最高得票的再投一次票,这个时候来决定。假如有更多的候选人,他每一次会把这个得票差的拿掉,拿掉以后再投,这是欧洲一般的选举方式。

  所以带来一个有趣的问题,为什么美国是两大党,民主党跟共和党,其他的党都很小。而为什么欧洲,比如说法国还有其他国家,有很多很多的小党,一般欧洲的国家你去看都有很多很多的小党,大家可能认为这是文化习惯或者传统来决定的,其实跟文化没有关系。

  为什么美国肯定是两大党,而欧洲会有很多很多的小党,很多很多党派,其实就是因为它的宪法里面,它的选举制度决定的,跟文化没有关系。举个例子,在你投票的时候,我假如投票给一个小党派,美国现在有民主党、共和党,我假如投票给一个小党派,那我这一票就浪费了,因为这个小党派不可能出线,他出不去的话我这一票就等于浪费,所以绝大部分人投票肯定投两大党,不然你的票就浪费了。

  欧洲为什么会有很多很多小党派呢?因为你第一轮投票的时候无所谓,你投了小党派表示你的意见,你表示你的意愿,然后以后你还有机会,这个小党派哪怕得票不够高的话,他下次还有机会再去投票,所以选民不会浪费他这张票。这就是为什么各个国家的党派的多少,并不是因为这个国家的文化所决定的,而是他的选举制度所决定的。

  Saari是我的导师,博士生导师,他是做经济学的。他有一个数学定理,基本上你用任何不同的投票方式,我都可以给这个例子。这个定理告诉我们什么呢?你总归会找到这种情形,你的任何投票方式都会决定你的投票结果。

  经济学家为什么要做这个?因为这是一个社会选择的问题,社会选择问题有很多应用,当然排名是一种方式,要把各个学校排名或者班级的学生排名,这都是一个选举方式,只不过这个时候投票不一定是真正的人去投,可能有其他的指标在投票。

  选举理论可以在这些领域用

  所以在选举里的一个应用是排名,第二个在招聘,还有商业管理和决策,一般人来讲都是有很多选择,你做哪一种选择?你想做最好的选择,这个时候你就要有一定的指标、一定的方式,来把它排名,哪个是第一个选择、第二个选择、第三个选择。还有你要找对象,比如说一个女孩,你想选一个女孩,这个时候她的排名或者你说投票,不是说你爸爸投一票、你的妈妈投一票、你的奶奶投一票,这当然也是一种投票方式,你决定选哪个对象。另外一个可能是你把这个女孩的各种素质,把它加起来,我来决定我把谁排在前面,把谁排在后面,你要选最好的。比方说你喜欢漂亮女孩的话,你打分,给这个漂亮女孩打这个分,然后你喜欢她的性格,那你把她的性格再打分,是不是钱很多,你也可以打分。所以整个你选取对象的方式也是一个排名,就是要各种各样的指标把它打分,这样你最后选择第一、第二、第三。

  大家知道有时候做这种选择是非常艰难的一个选择,找对象的时候很多人会动摇不定,不知道选哪个好,所以这个也在选举的范畴,这个也是大家需要考虑的,这个在经济学里面是非常重要的一个理论的一部分,是决策方面的。

  我们就来看固定的规则,看有什么情况会发生。举个例子,我是南方科技大学数学系主任,三年前在南科大创立了数学系,我们每年都要招很多人,现在每次招人一般是大家聚在一起,在系里面进行一个投票,看我们招谁。假如现在有四个人应聘想到南科大来工作,我们有30个老师,这30个老师每个人都有自己的想法,每个人都希望或者把自己的朋友招过来,或者希望招自己领域的同事,让自己领域能够发展。

  现在我有30个老师整体是这样一个情况,比如说这个例子有3个人他认为A最好,C第二,D第三,B第四,然后这4个人认为DCBA,我们当然系里面就要开始投票,看我们来决定选谁。这个是我们固定一个投票方式,我们不再去考虑其他的方式,就选一个,因为我们只招一个人。你投票以后发现什么呢?你会发现,投票谁得票最多呢?A总共有9票,这里九个人会投A,八个人投B,七个人会投C,这六个人会投D。也就是说我们投票的结果是A得票最多,B得票第二,C得票第三,D得票第四。投票好了以后,我作为系主任就开始打电话给A,然后说希望你到南科大来工作,问他你愿意不愿意来。A突然告诉我他会留在美国,不想回国,所以他不来。所以A我打电话给他,他告诉我非常抱歉,我不来了。那大家觉得我作为系主任,我应该干什么呢?我就会打电话给B,我非要招一个人不可。所以正常的想法是A他决定不来了,那么显然要给得票最多的第二多人,第二多人是B,这个时候大家觉得是非常自然的一个想法,我告诉大家这个可能最糟糕的一个想法,为什么呢?

  这个也是对的,但是我现在讲一个更糟糕的情形,刚才我说的也是。我在打电话之前,我打电话给A之前,这是另外一个例子,然后有一个人告诉我,D告诉我,他说我不想到你们南科大去工作了。就是我要给A打电话之前,D告诉我他不想到南科大工作,这个时候一般作为系主任来讲,D反正得票最少,你告诉我来与不来,跟我没什么关系,我仍旧要要给A打电话,告诉A我们要录用你。但是你会发现这是个非常糟糕的决定,为什么呢?假如D退出,他不再参加我们这个招聘,你重新去数一下票,就会发现什么呢? D不在了,我们重新再去数一下,A得9票,B得10票,C得11票。也就是说我们本来已经投票投好了,最差的那个D他告诉我他不来了,假如D不来了以后,你会发现突然一下子我们整个排序反了,这个时候我再去投票,发现C是最强的,而不是A。你会发现这个选举方法是不是很奇怪,而且很荒唐,用选举决定我们招聘谁的话,在这个情形之下,你会发现这基本上是很荒唐的一个过程。

  独裁是完美的选举方法?

  举了这么多的例子,那我们是不是可以找到一个完美的选举方法?其实从18世纪开始人们就想找一个完美的选举方法,到最后出来一个美国人, Kenneth Arrow,他去年刚去世,Arrow从数学上证明了一个定理。

  在这个定理之前,我首先讲两个假设,什么叫选举方法?第一,任何一个选举方法至少满足一些基本的条件,这些基本的条件是什么呢?第一个叫做Pareto条件,它的条件是什么呢?假如所有人的想法一致的话,你的选举结果必须跟大家想法一致,这个条件是个非常简单的条件。第二个条件,IIA条件, IIA假定讲的是什么事呢?A跟B相比的时候不应该受其他因素的影响。

  然后在这两个条件之下,Arrow定理说的什么呢?唯一满足这两个条件的选举方法,我们想找一个公正的、没有内在矛盾的选举方法,不是没有,有一个,而且是唯一的选举方法,是独裁。独裁什么意思呢?由一个人说了算,我们把某一个人的选票拿出来作为我们的结果。

  为什么这个选举方法满足呢?这个显然满足第一个条件,因为所有人想法一样,这一个人的想法和大家一样;第二个,它没有任何内在矛盾,除了独裁而外,没有任何一个选举方法是合理的、没有内在矛盾的。

  这个事让大家非常失望,Arrow花了近十年,去寻求一个非常完美的选举方法,证明了一个数学定理,就是不存在没有自相矛盾的选举方法,当然除了独裁,。Arrow的这个定理使他得了诺贝尔经济学奖,在选举理论里,这是非常基础的一个定理。这里面的学问非常非常大,Arrow拿了诺贝尔奖以后,他有六个学生都拿到了诺贝尔经济学奖。在经济学里,社会选择是一个非常有意义的学科。这些人都有一个共同的特点,这些人本科都读的数学,以后再去读的经济学。

  我们显然不喜欢数学上最完美的选举方法,也就是独裁。我想大家可能都有共识,就是所有的东西不能一个人说了算。你可能要问了,有没有哪个方法比其他方法更好一些?这个其实有一些定论,有些方法比其他方法更好一些,有些方法比较糟糕。最好的方法数学上可以证明,是BORDA COUNT,就是加权的方法。假如选五个人,最高的人给4分,第二高的给3分,依次给2分、1分、0分,就是给他打分,从上到下,从数学上可以证明这是最佳的选举方法。因为它充分考虑到选举的每个人之间的排序,而且给相差一分的这种排序方法是最合理的。为什么这么说?什么方法说这个最合理呢?是要从概率上,用这种方法进行排序的话,它发生问题的概率最小。

  相对比较完美的选举方式

  为什么这个情况下发生问题的概率最小,在选举理论里面有一个简单的例子叫Condorcet Cycle,一个死循环,就像打乒乓球一样,A打的过B,B打的过C,C又打的过A,这种循环之下很难断定是谁更好、谁更差,所以这个时候用Borda Count,所谓的Borda Count这种选法,用这种直接的方法去数分数的话,刚好完美的把对称性考虑进去了,所以用Borda Count这种方法打分的方式,是一个相对比较完美的选举方式。

  刚才说Borda的这个选举方法,从概率上讲它是出问题最小的一个方法。但是现在有一个问题,当初跟Condorcet他们在争论的时候争论到一个问题:策略性的投票,这个策略性的投票是什么呢?我刚才说了,你给第一名打最高的分数,第二名降一分,再一名降一分,这个在理论上是非常好的一个方法,它能避免很多问题,但是在实际操作的时候突然发现,在法国科学院投票的时候就发现这个问题,发现这个问题是什么问题呢?我喜欢A,我给A打满分,但是有可能B非常强,是A的竞争对手,这个时候这些人故意的压低,本来A是最好,他认为A最好,B第二,但是他为了怕B跟A去抢票,所以他恶意的去把B的分数降到最低,给他0分,这是非常有趣的一个问题,在投票理论里面。投票理论不仅要考虑从数学上的完善,也要考虑在实用上的完善。在实用的过程中你会发现,假如你用Borda这种方式投票打分的话,你会发现有很多人不按照这个规则去(打分),他故意不按照他自己的想法去投票,而是恶意的去压低竞争对手的分数,所以在实用过程中就发现了这个问题。

  当初Condorcet和Borda在争论的时候,到最后Borda也没有办法,他就说我的方法只对诚实的人有用,对不诚实的人是没有用的。所以他最后也承认我的方法只能对诚实的人有用。

  但是整个这个世界在投票过程中都是恶意竞争,所以所有恶意的方法都会用出来,这也就是为什么从数学上证明了Borda的方式是最好的方式,但是为什么没有经常性的使用的原因。

  在实际过程中,在各个国家政府、各个国家议院都会发生的一个现象,你只要允许他随意打分,都会有不少人去压低他的对手的分数。尽管最强的三个人,比如说最强的肯定是A跟B,但是他会故意的把B分数打低,分数哪怕送给C,他不能把这个分数送给B。这是投票另外一个方面的问题。假如纯去打分的话,这个方法就避免了我们刚才说的Arrow定理提到的内在矛盾问题,但是它带来的其他问题比Arrow选举方法的问题还要多。

  排名是如何进行的

  最后谈谈排名。排名现在怎么做的呢?一般的排名。比如说一个大学我现在想排名,大家知道很多不同的排名方式,而且有时候他们都说排名是公正的、是公开的,他把指标的权重都把它公开。

  其实这里面的猫腻非常非常多,一个排名的方式往往是给各种指标,你可以把这个指标算成是一个人,比如说这个学校的师资力量算成是一个投票,这个学校的学生质量作为一个投票,把学校的就业情况作为一票,跟其他所有的办学相关的你都可以把它当成一票。但是这个时候权重不一样,比如说你的科研质量算成十票,你的其他各种指标可以把它算成一票,比方说最后所有的排名方式就是基于加权平均得来的。其中加权平均还有一个地方,就是他的学校的声誉,声誉本身也是一个投票排名来的,那个也是很多人给这个学校打分得来的,这本身就是一个投票的部分。然后其他的排名都是用各种指标,这些指标作为一个因素,然后进行排名。

  即使定了权重以后,里面还有很多东西、很多地方可以去调整。所以基本上这个排名到最后,是把所有的权重加起来,然后大家进行一个选取。你假如跟排名的人好,或者我是上海交大的,比方说我做一个排名,或者我是浙江大学的,比方说我做一个排名,这两个学校都在做,那显然上海交大和浙大的排名名次高,这里面很多很多参数,你去调整一下,基本上让他名次往上高上去,根本是很容易的事,所以这是关于排名。这是为什么你们看到的排名,各种排名的方式决定了这个排名的顺序,当然有些地方是公认的,有些不是公认的,有些地方有很多的操作在里面。

  足球联赛排名那些事

  当初2003年的时候,那个时候中国有甲A,甲A每年要淘汰一些(球队),每年其他的要晋升上来,要保住甲A的位置当然对各个足球队非常重要。那个时候中国足协有一个规定,怎么排名呢?上年度的排名乘以0.5,加上本年度排名,最后作为最终排名。这个大家想想挺有道理的,我们今年打的比赛排一个名,然后把去年的排名乘以0.5,然后加起来看谁的排名名次高。一用起来你会发现一个问题,这个问题在哪里呢?最后一轮比赛,重庆跟天津争夺最后一个中超的名额,这个时候重庆突然发现本年度的排名已经定下来了,我无论胜还是败,我的名次已经决定,最后一轮假如输给青岛的话,就有机会让青岛超过天津,自己可以成功的晋级。重庆一上来就输了三个球,就是故意的输了三个球。也就是说他故意的把球输给了青岛,青岛就有机会打败天津,然后他就可以晋级。这个时候他一输以后,足协就开始发现这个问题了,他故意输球,而且很有可能他输球了以后会晋级,这一点就很惨。

  这个时候,足协到最后为了确保这个事情不发生,足协就做工作,确保要让天津战胜上海,他就要去劝,上海本来是要拿冠军的,而且打天津本来是没有问题的。但是假如上海真的把天津打败的话,天津就会下去,结果重庆输了球反而有好处的情况(就会发生),到最后足协只好劝上海不要拿冠军,这样就把重庆给压下去,果然,本来是要夺冠军的,然后足协做工作,所有这些东西都违反了体育精神,但是足协到最后做工作,让上海顾全大局,最后把球输给了天津。

  所以你可以看到排名非常荒唐的一幕,这是一个非常实实在在的例子,我从新闻里面把它拿下来的,大家可能认为,新闻上认为是足协太笨,其实不是足协太笨,就是因为我们刚才说的Arrow定理,以任何方式来排名,它都会有自相矛盾,都会出现这一类型的情况,所以这个事不能怪足协,只能怪我们没有一个完美的选举方法。(图片来源于作者演讲PPT)

  注:本文根据夏志宏老师在墨子沙龙的演讲整理而来,有删减。

  《科学大家》专栏投稿邮箱:sciencetougao@sina.com  来稿请注明姓名、单位、职务

了解更多信息 欢迎关注科学探索微信公众号及微博了解更多信息 欢迎关注科学探索微信公众号及微博
新浪科技公众号
新浪科技公众号

“掌”握科技鲜闻 (微信搜索techsina或扫描左侧二维码关注)

创事记

科学探索

科学大家

苹果汇

众测

专题

官方微博

新浪科技 新浪数码 新浪手机 科学探索 苹果汇 新浪众测

公众号

新浪科技

新浪科技为你带来最新鲜的科技资讯

苹果汇

苹果汇为你带来最新鲜的苹果产品新闻

新浪众测

新酷产品第一时间免费试玩

新浪探索

提供最新的科学家新闻,精彩的震撼图片