中国科学家助战人机大战：帮沃森理解人类语言

http://www.sina.com.cn 2011年02月17日 10:58 解放日报

　　本报记者林环

　　早在美国当地时间1月13日的练习赛中，IBM的超级电脑“沃森”已险胜美国最受欢迎智力问答节目《危险边缘》的两名冠军选手。IBM副总裁约翰·凯利说，IBM的中国大陆科学家 “做出了重要贡献”，他们帮助“沃森”处理人类的自然语言，并迅速对复杂问题作出回答，他们贡献了可以让“沃森”更快“思考”的软件，助战人类有史以来的第一次人机智力问答对决。

　　是什么让“沃森”理解人类语言、学会人类思考？

　　与1997年击败“世界上最聪明的人”、国际象棋大师卡斯帕罗夫的“深蓝”相较，究竟“谁”更“聪明”？

　　“沃森”项目的中国大陆负责人之一、IBM中国研究院高级经理潘越，与本报连线，接受了首次中国媒体专访。

　　《危险边缘》有多“危险”

　　“Winter(冬天)走了”——这句话，只要有一定的上下文语境，就不难判断其意思。可是电脑呢？它要分析此“Winter”指的到底是冬天，还是一个叫“Winter”的人名，却绝非易事。

　　“沃森”面对的智力问答挑战，远远难过上述例子。

　　《危险边缘》堪称美国历史上最受欢迎的智力问答节目：1984年推出，至今已获28次艾美奖(美国电视界的最高奖)，在游戏类节目的尼尔森排行榜上，位居榜首达1000个星期，并作为获得最多奖项的游戏类电视节目，载入吉尼斯世界纪录。

　　每期节目由3名竞争者参加问答。主持人宣布6大类问题，竞争者们选择一类作答。通常这6个类别名都让人摸不着头脑，比如“做饭”、“20世纪出版”、“白衫大学女生”等。而具体每一道题只提供某些线索，让选手反推问题，比如线索为“美国之父，砍倒樱桃树”，那抢答的选手可以回应：“谁是乔治·华盛顿？”当然，如果抢答失败，会被扣除对应的奖金。

　　“沃森”的两个对手都是《危险边缘》史上的传奇人物：肯·詹宁斯曾连续74场赢得比赛，奖金总额超过250万美元，破了美国电视游戏节目获胜场次的纪录；而布拉德·鲁特尔是参加《危险边缘》的选手中获最高奖金者，在2002年和2005年的比赛中，共拿到奖金近330万美元。

　　新闻视点：《危险边缘》难道是一个比国际象棋还要难的智力挑战吗？

　　潘越：我认为是。首先，国际象棋的规则定义非常明确，而人的自然语言，完全是开放式的，往往很模糊，需要上下文才能理解意思。这点人类看着容易，对电脑却极具挑战性。其次，《危险边缘》不是简单地一问一答，而是提及线索，让选手反推问题，线索范围非常广，我们曾经分析随机挑选的2万个线索，发现涉及明星、地点等2500种不同类型的事物。因此，就每一条未知线索的相应答案建一个数据库，是不可能的。另外，在参加节目时，“沃森”不能与互联网连接，必须全靠自身力量。还有一点也很头疼，节目里如果回答错误，会受到惩罚，也就是说“沃森”不仅要给出答案，而且要对答案相当有信心。这是史上第一次电脑学会像人类一样思考，从微妙的反语、双关语和谜语中，排除干扰性内容，寻找唯一答案，在比赛中击败人类智力高手。

　　中国科学家的贡献有多“重要”

　　《纽约时报》杂志称“沃森”为“全世界最善于回答问题的机器”。而据IBM副总裁约翰·凯利所说，中国大陆科学家做出的重要贡献，即帮助“沃森”处理人类的自然语言并迅速回答复杂问题。“我们的中国研究室有着杰出的研究人员，他们很多人都精通语言学、分析学和我们称为 ‘机器学习’的领域。”

　　“沃森”是由IBM公司在世界各地的研究人员，历时4年共同研究的成果。确切地说，无论从参与人数还是实际贡献而言，中国研究院是该项目“美国本土以外最主要的研究力量”。事实上，同样出自IBM公司的著名超级电脑“深蓝”，其“项目之父”许峰雄博士也曾因华裔身份给国人留下深刻印象，他在1988年开发的超级电脑“深思”，因首次战胜人类象棋特级大师本特·拉尔森而声名大振，1989年加盟IBM研究院，与合作伙伴开始“深蓝”项目的研究。

　　新闻视点：中国科学家的“重要贡献”具体指什么？

　　潘越：在该项目的IBM全球研究团队中，有多位来自IBM中国研究院的研究人员。我们负责为“沃森”系统采集、分析和使用各种结构化的知识。而美国研究院侧重于非结构化的知识，即形式相对不固定的类似百科全书的知识，范围虽然广，但有局限。我们则以范围虽小但信息更可靠的结构化知识，提供问题解答，排除让系统显得“愚蠢”的答案，以帮助“沃森”更准确地思考。当然，结构化知识的数据非常多，需要强大的万维网管理来提高解答速度，正好我们之前开发的引擎能够适用，从而帮助“沃森”更快地思考。如今，来自IBM中国研究院的很多技术成果已经融入在“沃森”系统中，有的研究成果则成为整个科研团队的借鉴和参考。同时，来自中国高校的优秀博士生，也参与到了这一挑战性问题的研究中。

　　“深蓝”与“沃森”哪个更“聪明”

　　10组Power 750服务器，运行linux操作系统，15TB(1TB＝1024GB)内存，2880个处理器，每秒可进行80万亿次运算——这是体积为10个冰箱大小的超级电脑“沃森”的数据。比赛时，庞大的“沃森”甚至并不与选手在同一房间内，它的服务器要占据整整一个房间。约翰·凯利通俗地打了个比方，“沃森”所存储的信息，相当于2亿页图书，“就初始计算能力来说，‘沃森’的能力大约是‘深蓝’的1000倍。”

　　1997年5月，被誉为“世界上最聪明的人”的国际象棋大师卡斯帕罗夫，经过6局对抗后，败于“拥有超人的计算能力”的超级电脑“深蓝”，全球瞩目，被称作“里程碑式的人机博弈”。

　　新闻视点：有报道称，研究人员说“沃森”比“深蓝”更“聪明”。但“沃森”不就是存储了大量信息的搜索引擎吗？

　　潘越：“沃森”所要做的，比搜索引擎的工作多得多。按比赛规则，“沃森”每次只能提供一个答案，而搜索引擎只能给出一篇或多篇可能包含答案的文章列表，用户还需要花脑力去发现确切答案。那么可能有人会问，设计一种软件，从搜索引擎给出的排在第一位的文章里找出答案，不是也可以吗？关于这点，我们做过研究。按现有搜索引擎，准确度只能达到个位数，然而“沃森”的准确率约达85%。

　　还有一点很关键，“沃森”不仅要给出答案，而且必须是有把握的答案，不然反而失分。而一道线索的理解，往往有多种，比如10种理解，再比如根据每种理解产生10个答案，那么一道线索就会有100种答案，其中哪一种最有可能是正确的，就需要辅以各种各样的证据来看哪一种的支持率最高。也就是说，“沃森”的计算速度和资源消耗量，现有搜索引擎没有可比性。

　　新闻视点：美国当地时间1月13日的练习赛，是“沃森”的首次公开展示。此前它曾秘密与《危险边缘》的选手展开了多场比赛，战况如何？

　　潘越：胜多负少。

　　新闻视点：虽然“沃森”设计用于参加《危险边缘》，但这项技术的应用不止于此吧？

　　潘越：可以广泛应用于医疗、在线自助咨询等专业领域。比如老百姓得了什么病，可以通过它来循症判断，帮助筛选海量信息后准确诊断病情；比如游客到了一个陌生的城市，可以通过它来获取有效的城市公共信息服务。总之，这种技术将允许人类与机器更自由地交流，人们可直接向电脑提问，取代键盘输入后再查找、分析等。

　　人脑电脑孰优孰劣

　　练习赛中，“沃森”共获4400美元的奖金，相比之下，肯·詹宁斯与布拉德·鲁特尔分别拿到3400美元和1200美元。而日前某门户网站连续一个月的竞猜中，认为“沃森”获胜的票数，竟接近“人类选手获胜”的两倍。

　　电脑叫板人脑，自“深蓝”挫败卡斯帕罗夫后就屡被提及。“这是一部像人的机器，和一个像机器的人之间的决斗。”当时世界排名第二的棋手阿南德，曾如此评价这一瞩目战局。那时，猜测“人类制造的机器会将人打败”的人数不少。以至于2003年卡斯帕罗夫再次“人机大战”的一开局，就被定调为“要为人类争面子”。

　　从1997年至2003年，对阵的电脑已由1秒钟内能算出2亿个棋步，进步为112亿个棋步，“棋力”长了56倍。而且，它仍然拥有不受身体、心情和天气变化等影响的“心理素质”优势。但2003年那一役，“人机大战”四个回合后以平局告终。

　　事实上，所谓的“人机大战”，只是人类在挑战自己的智慧。或许正是这种不断挑战的压力，才使得人类的科技水平与人类社会的发展相互见长。因此，人脑电脑孰优孰劣，其实并不能算作一个问题。

　　从2009年冬天开始，IBM的科学家们已经开始模拟《危险边缘》的直播现场，测试“沃森”与真人对抗的能力。他们布置专门的比赛场地，聘请主持人，还请来该节目以往的参与者扮演对手。但当本报记者问潘越“沃森”在比赛中最大的挑战是什么？他的回答仍是“人类语言，比如双关语”。当美国网站记者问“沃森”项目主管埃里克·布朗，对最终胜出是否有信心时，布朗说：“我们充满信心，但表演赛只有两场比赛，一切皆有可能发生。”

　　尽管即将到来的《危险边缘》正式人机对决很可能惊心动魄，但今天的人们似乎已不必把比分看得那么重要。以IBM创始人托马斯·沃森的姓来命名的“沃森”，其背后蕴藏的商业价值，才是许多人真正关注的重点所在。如IBM的科学家坎贝尔所说，“制造解决其他问题的‘深蓝’，是研制‘深蓝’的最终目标”……