美国电影网站是怎么给电影评分的?

2016年12月30日 09:40 PingWest
微博 微信 空间 分享 添加喜爱

  PingWest / 光谱

  最近几天,中文互联网上最专业的影评网站“豆瓣电影”成为了电影界激烈讨论的对象。一篇来自广电总局官办的《中国电影报》的文章,称豆瓣电影以及其他社交平台上“个别大V、公众号为博眼球、圈粉丝、流量变现等目的,发布恶意的、不负责任的言论,严重破坏了中国电影的生态环境。”

  这件事还真是挺有点活久见的。在美国,如果有这样的批评来自无论民间还是官方,那简直是要笑掉大牙了——从来没听说过一两篇影评,一两家网站就能糟蹋了一国电影生态环境的。如果真有,这国的电影生态环境是有多脆弱呀。

  在美国,也有这么几个和豆瓣类似,跟电影有关,主流网民经常访问的网站:专业存储电影信息兼职打分的 IMDb(Internet Movie Database 互联网电影数据库)、创立快二十年几经易手的烂番茄 (Rotten Tomatoes)、 专业网络购票副业打分的“美国版猫眼”Fandango,以及专门聚合书籍和视听出版产品批评意见的 Metacritic。

  随着互联网和社交网站的快速普及,这几个网站也形成了独特的电影打分机制,虽然各不相同,但还都挺受电影市场片方、观众和专业批评人士的信任。这也让它们在国内甚至国际上成为了具有公信力的电影评分网站。

  它们是怎样工作的呢?

  IMDb

  现在市面上有一个比较流行的 IMDb 加权分计算公式,大概长这个样子:

  v = 投票人数,实际上是经常投票的人数,也即 IMDb 活跃用户投票数

  m = 进入 IMDb Top 250 榜单所需的最小票数

  R = 该电影的平均分(分数相加除以人数)

  C = IMDb 数据库所有电影的平均分

  这是一个在统计学上公认比较科学的贝叶斯算法实例。但需要明确的是,这个公式只是 IMDb 维护 Top 250 电影榜单所使用的,并不是每一部新电影打分都采用这个方法。

  平常,IMDb 的用户可以用 1-10 颗星 来为一部电影打分,最后 IMDb 会计算出一个加权平均星数作为得分。用最近上映的星战外传电影《侠盗一号》举例,在 IMDb 上的得分是 8.2。目前《侠盗一号》在 Top 250 榜单里排名 205,也就是说我们可以确定它的得分是用上面那个公式计算得到得了。

  但是,为了维护评分的公正,这个日常评分的计算公式仍然是个不能公开的秘密——可知的是,结果依然是加权分,采用了算术平均数 (Arithmetic mean) 的计算方法,但由于算数平均数容易受到极端数据的影响,IMDb 也设计了一些过滤机制。

  很明显,IMDb 得分是一个普通观众打分的结果。就像美国总统大选有全民投票 (popular vote) 和选举人票 (electoral vote) 一样,IMDb 在全面和公正的同时,也想要追求专业,体现一下电影人的意见。于是在 上图的 “Ratings” 后面,还有一个百分制的 “Metascore”。

  这第二个得分又是怎么来的呢?这就要提到 Metascore 的来源 Metacritic 了。

  Metacritic

  Metacritic 是一个出版物专业批评聚合网站,成立于 1999 年。最早从书评起家,现在的 Metacritic 的批评对象已经涵盖了音乐专辑、电影、电视剧、电子游戏等视听出版物。注意,重点在于“专业”二字。

  要体现专业,首先,Metacritic 为电影打出的 Metascore 是从主流媒体和专业影评机构的影评人那里聚合而来的,这是它和 IMDb 评分最主要的不同。这些影评人和他们供职的机构,大多在影评方面具有公信力,比如《卫报》、《纽约时报》、《滚石》、《好莱坞记者》,《时代周刊》和 NPR 等这样的大报和电台,都是能参与 Metascore 计算的专业影评来源。

  但不是每个机构和影评人都会自己给出一个准确的分数。实际上 Metacritic 是这样做的:来源有分数就用来源分数;来源有星数就大概换算成百分制的分数;如果来源的影评只有文字没有评分,他们就自己找人去阅读影评,然后根据读完的感受自己给一个分,然后再用这个分拿去计算……

  虽然这样计算出的 Metascore,看上去不是特别能够准确和真实地体现批评家的感受,但至少这十几年过来 Metacritic 没怎么被质疑过。尽管如此,Metacritic 在 Metascore 之外也还是设立了一个 Userscore——不会展现在一部电影的页面上,但用户投票的工具会直接放在 Metascore 的下方,给用户一种投了票就能影响得分的错觉(详见下图)。

  Metascore 采用百分制,Userscore 打分采用十分制。还是用《侠盗一号》举例,现在的 Metascore 是 65, 整合了 51 个专业来源;Userscore 是 7.7,基于 1489 个用户打分。

  烂番茄

  烂番茄创立于 1998 年,一直致力于提供具有公信力的电影打分。其创始人帕特里克·李曾经在 Pingwest品玩的 SYNC 2016 科技大会上介绍过烂番茄的极盛时的风光和设立的机制。这么来看,烂番茄也算是影评界的不老松。

  烂番茄没有评分!必须明确烂番茄采用的评价系统叫做 Tomatometer,一般翻译成“新鲜度”。一部电影的新鲜度,同样是由专业的影评意见所决定的。在烂番茄上影评人不打分,也不给星,只能给出 Fresh(一个新鲜番茄)和 Rotten(一个烂番茄)两种标记,分别代表推荐和不推荐。

  如果超过 60% 的影评人推荐一部电影,电影的新鲜度就会整体为 Fresh,旁边有一个百分比显示新鲜度,也即具体多大比例的影评人推荐;如果超过 75% 的影评人推荐,像《侠盗一号》一样,新鲜度就会变成“Certified Fresh”;但如果给 Fresh 的影评人低于 60%,电影就只能得到那一坨绿色的烂番茄了。

  和 Metacritic 一样,烂番茄也需要确保用户的意见能够得到体现,于是又设定了一个 Audience Score(观众分数)。这个观众分数采集来源是观众打星,但最后体现出来的所有打出 3 星半 以上的用户比例。

  用打好评的影评人/用户占总影评人/用户人数的比例,而不是一个简单的数值来评价一部电影,是烂番茄和其他影评网站在本质上的最大区别。它突出的是人群对一部电影持有的主流观点,而不是用一个无法让每个评价者都感同身受的数值。

  这个设定让烂番茄获得了相当高的信誉,但也不是所有粉丝都能接受的了。比如今年的美国大厂烂片代表作《自杀小队》的粉丝,就被糊了一脸只有 26% 新鲜度的烂番茄。结果这些粉丝以烂番茄敌视 DC 扩展宇宙电影的罪名,在网上发起集体签名,要求烂番茄关站谢罪……

  Fandango

  2000 年成立的 Fandango(原名 Tickemaker),可以被理解为美国版猫眼。它慢慢统一了美国混乱的网络票务市场,现在最主要的功能就是网上买电影票,查座位情况,以及查看影评等等。

  Fandango 对粉丝、用户的地位和意见非常重视,在影评机制上得到了体现。Fandango 的电影评价完全采用粉丝打分作为依据。在该网站上,超过 17000 名粉丝给《侠盗一号》打出了 4 星半的评价。

  Fandango 的评分计算方式看上去并不复杂,应该没有什么加权和过滤机制。这也导致了该网站上 3 星以下电影的数量比烂番茄、Metacritic 和 IMDb 要少得多。幸好 Fandango 加上了比较专业和严苛的烂番茄新鲜度,以及专业的家庭电影评价机构意见(上图右上角),来中和什么烂片都能咽得下去的粉丝打分。比如星爵克里斯·普拉特和大表姐珍妮佛·劳伦斯主演的《太空旅客》,粉丝打了 4 分,却得到了一颗只有 31% 新鲜度的烂番茄,也被负责任的专业机构标注了“露骨的性爱场景”、“过量的饮酒场景”、“令人恐惧的溺水场面”,可能不适宜儿童观看……

  所以你看,资深人士从电影的艺术和学术的角度进行的专业批判,和普通观众以获得的感官愉悦和心理满足程度给出的打分,就是这样在互联网上和平共处的。

  幸运的是,美国商业电影市场经过了一百年的发展已经格外成熟,无论是创作、制作、院线、影评还是周边开发,都已经走在一条相当专业化的道路上,不太可能像这几天的中国电影界一样,发生如此严重的争吵。在美国,佳片会收到它应得的票房和好评作为奖赏,烂片就算进了电影院也不可能躲得开差评——无论在报纸、电台还是互联网上。在美国,对电影的批评,也是言论自由保护的一部分。

  若差评不自由,则高分无意义。连中国前总理周恩来都《在文艺工作座谈会和故事片创作会议上的讲话》里说过,“人民喜闻乐见,你不喜欢,你算老几?”

推荐阅读
聚焦
关闭评论