跳转到路径导航栏
跳转到正文内容

中国科学家助战人机大战:帮沃森理解人类语言

http://www.sina.com.cn  2011年02月17日 10:58  解放日报

  本报记者 林环

  早在美国当地时间1月13日的练习赛中,IBM的超级电脑“沃森”已险胜美国最受欢迎智力问答节目《危险边缘》的两名冠军选手。IBM副总裁约翰·凯利说,IBM的中国大陆科学家 “做出了重要贡献”,他们帮助“沃森”处理人类的自然语言,并迅速对复杂问题作出回答,他们贡献了可以让“沃森”更快“思考”的软件,助战人类有史以来的第一次人机智力问答对决。

  是什么让“沃森”理解人类语言、学会人类思考?

  与1997年击败“世界上最聪明的人”、国际象棋大师卡斯帕罗夫的“深蓝”相较,究竟“谁”更“聪明”?

  “沃森”项目的中国大陆负责人之一、IBM中国研究院高级经理潘越,与本报连线,接受了首次中国媒体专访。

  《危险边缘》有多“危险”

  “Winter(冬天)走了”——这句话,只要有一定的上下文语境,就不难判断其意思。可是电脑呢?它要分析此“Winter”指的到底是冬天,还是一个叫“Winter”的人名,却绝非易事。

  “沃森”面对的智力问答挑战,远远难过上述例子。

  《危险边缘》堪称美国历史上最受欢迎的智力问答节目:1984年推出,至今已获28次艾美奖(美国电视界的最高奖),在游戏类节目的尼尔森排行榜上,位居榜首达1000个星期,并作为获得最多奖项的游戏类电视节目,载入吉尼斯世界纪录。

  每期节目由3名竞争者参加问答。主持人宣布6大类问题,竞争者们选择一类作答。通常这6个类别名都让人摸不着头脑,比如“做饭”、“20世纪出版”、“白衫大学女生”等。而具体每一道题只提供某些线索,让选手反推问题,比如线索为“美国之父,砍倒樱桃树”,那抢答的选手可以回应:“谁是乔治·华盛顿?”当然,如果抢答失败,会被扣除对应的奖金。

  “沃森”的两个对手都是《危险边缘》史上的传奇人物:肯·詹宁斯曾连续74场赢得比赛,奖金总额超过250万美元,破了美国电视游戏节目获胜场次的纪录;而布拉德·鲁特尔是参加《危险边缘》的选手中获最高奖金者,在2002年和2005年的比赛中,共拿到奖金近330万美元。

  新闻视点:《危险边缘》难道是一个比国际象棋还要难的智力挑战吗?

  潘越:我认为是。首先,国际象棋的规则定义非常明确,而人的自然语言,完全是开放式的,往往很模糊,需要上下文才能理解意思。这点人类看着容易,对电脑却极具挑战性。其次,《危险边缘》不是简单地一问一答,而是提及线索,让选手反推问题,线索范围非常广,我们曾经分析随机挑选的2万个线索,发现涉及明星、地点等2500种不同类型的事物。因此,就每一条未知线索的相应答案建一个数据库,是不可能的。另外,在参加节目时,“沃森”不能与互联网连接,必须全靠自身力量。还有一点也很头疼,节目里如果回答错误,会受到惩罚,也就是说“沃森”不仅要给出答案,而且要对答案相当有信心。这是史上第一次电脑学会像人类一样思考,从微妙的反语、双关语和谜语中,排除干扰性内容,寻找唯一答案,在比赛中击败人类智力高手。

  中国科学家的贡献有多“重要”

  《纽约时报》杂志称“沃森”为“全世界最善于回答问题的机器”。而据IBM副总裁约翰·凯利所说,中国大陆科学家做出的重要贡献,即帮助“沃森”处理人类的自然语言并迅速回答复杂问题。“我们的中国研究室有着杰出的研究人员,他们很多人都精通语言学、分析学和我们称为 ‘机器学习’的领域。”

  “沃森”是由IBM公司在世界各地的研究人员,历时4年共同研究的成果。确切地说,无论从参与人数还是实际贡献而言,中国研究院是该项目“美国本土以外最主要的研究力量”。事实上,同样出自IBM公司的著名超级电脑“深蓝”,其“项目之父”许峰雄博士也曾因华裔身份给国人留下深刻印象,他在1988年开发的超级电脑“深思”,因首次战胜人类象棋特级大师本特·拉尔森而声名大振,1989年加盟IBM研究院,与合作伙伴开始“深蓝”项目的研究。

  新闻视点:中国科学家的“重要贡献”具体指什么?

  潘越:在该项目的IBM全球研究团队中,有多位来自IBM中国研究院的研究人员。我们负责为“沃森”系统采集、分析和使用各种结构化的知识。而美国研究院侧重于非结构化的知识,即形式相对不固定的类似百科全书的知识,范围虽然广,但有局限。我们则以范围虽小但信息更可靠的结构化知识,提供问题解答,排除让系统显得“愚蠢”的答案,以帮助“沃森”更准确地思考。当然,结构化知识的数据非常多,需要强大的万维网管理来提高解答速度,正好我们之前开发的引擎能够适用,从而帮助“沃森”更快地思考。如今,来自IBM中国研究院的很多技术成果已经融入在“沃森”系统中,有的研究成果则成为整个科研团队的借鉴和参考。同时,来自中国高校的优秀博士生,也参与到了这一挑战性问题的研究中。

  “深蓝”与“沃森”哪个更“聪明”

  10组Power 750服务器,运行linux操作系统,15TB(1TB=1024GB)内存,2880个处理器,每秒可进行80万亿次运算——这是体积为10个冰箱大小的超级电脑“沃森”的数据。比赛时,庞大的“沃森”甚至并不与选手在同一房间内,它的服务器要占据整整一个房间。约翰·凯利通俗地打了个比方,“沃森”所存储的信息,相当于2亿页图书,“就初始计算能力来说,‘沃森’的能力大约是‘深蓝’的1000倍。”

  1997年5月,被誉为“世界上最聪明的人”的国际象棋大师卡斯帕罗夫,经过6局对抗后,败于“拥有超人的计算能力”的超级电脑“深蓝”,全球瞩目,被称作“里程碑式的人机博弈”。

  新闻视点:有报道称,研究人员说“沃森”比“深蓝”更“聪明”。但“沃森”不就是存储了大量信息的搜索引擎吗?

  潘越:“沃森”所要做的,比搜索引擎的工作多得多。按比赛规则,“沃森”每次只能提供一个答案,而搜索引擎只能给出一篇或多篇可能包含答案的文章列表,用户还需要花脑力去发现确切答案。那么可能有人会问,设计一种软件,从搜索引擎给出的排在第一位的文章里找出答案,不是也可以吗?关于这点,我们做过研究。按现有搜索引擎,准确度只能达到个位数,然而“沃森”的准确率约达85%。

  还有一点很关键,“沃森”不仅要给出答案,而且必须是有把握的答案,不然反而失分。而一道线索的理解,往往有多种,比如10种理解,再比如根据每种理解产生10个答案,那么一道线索就会有100种答案,其中哪一种最有可能是正确的,就需要辅以各种各样的证据来看哪一种的支持率最高。也就是说,“沃森”的计算速度和资源消耗量,现有搜索引擎没有可比性。

  新闻视点:美国当地时间1月13日的练习赛,是“沃森”的首次公开展示。此前它曾秘密与《危险边缘》的选手展开了多场比赛,战况如何?

  潘越:胜多负少。

  新闻视点:虽然“沃森”设计用于参加《危险边缘》,但这项技术的应用不止于此吧?

  潘越:可以广泛应用于医疗、在线自助咨询等专业领域。比如老百姓得了什么病,可以通过它来循症判断,帮助筛选海量信息后准确诊断病情;比如游客到了一个陌生的城市,可以通过它来获取有效的城市公共信息服务。总之,这种技术将允许人类与机器更自由地交流,人们可直接向电脑提问,取代键盘输入后再查找、分析等。

  人脑电脑孰优孰劣

  练习赛中,“沃森”共获4400美元的奖金,相比之下,肯·詹宁斯与布拉德·鲁特尔分别拿到3400美元和1200美元。而日前某门户网站连续一个月的竞猜中,认为“沃森”获胜的票数,竟接近“人类选手获胜”的两倍。

  电脑叫板人脑,自“深蓝”挫败卡斯帕罗夫后就屡被提及。“这是一部像人的机器,和一个像机器的人之间的决斗。”当时世界排名第二的棋手阿南德,曾如此评价这一瞩目战局。那时,猜测“人类制造的机器会将人打败”的人数不少。以至于2003年卡斯帕罗夫再次“人机大战”的一开局,就被定调为“要为人类争面子”。

  从1997年至2003年,对阵的电脑已由1秒钟内能算出2亿个棋步,进步为112亿个棋步,“棋力”长了56倍。而且,它仍然拥有不受身体、心情和天气变化等影响的“心理素质”优势。但2003年那一役,“人机大战”四个回合后以平局告终。

  事实上,所谓的“人机大战”,只是人类在挑战自己的智慧。或许正是这种不断挑战的压力,才使得人类的科技水平与人类社会的发展相互见长。因此,人脑电脑孰优孰劣,其实并不能算作一个问题。

  从2009年冬天开始,IBM的科学家们已经开始模拟《危险边缘》的直播现场,测试“沃森”与真人对抗的能力。他们布置专门的比赛场地,聘请主持人,还请来该节目以往的参与者扮演对手。但当本报记者问潘越“沃森”在比赛中最大的挑战是什么?他的回答仍是“人类语言,比如双关语”。当美国网站记者问“沃森”项目主管埃里克·布朗,对最终胜出是否有信心时,布朗说:“我们充满信心,但表演赛只有两场比赛,一切皆有可能发生。”

  尽管即将到来的《危险边缘》正式人机对决很可能惊心动魄,但今天的人们似乎已不必把比分看得那么重要。以IBM创始人托马斯·沃森的姓来命名的“沃森”,其背后蕴藏的商业价值,才是许多人真正关注的重点所在。如IBM的科学家坎贝尔所说,“制造解决其他问题的‘深蓝’,是研制‘深蓝’的最终目标”……

分享到:

新浪简介About Sina广告服务联系我们招聘信息网站律师SINA English会员注册产品答疑┊Copyright © 1996-2011 SINA Corporation, All Rights Reserved

新浪公司 版权所有