人机大战击败李世石后 AlphaGo下一步会干嘛?

2016年03月12日 15:52 雷锋网
微博 微信 空间 分享 添加喜爱

  【导读】击败围棋只不过是一个开始,AlphaGo 的开发公司 DeepMind 在游戏、医疗、机器人以及手机方面都有规划。The Verge 非常迅速地采访到了 DeepMind 的创始人Demis Hassabis,他说自己也被 AlphaGo 咄咄逼人又胆大包天的下法惊呆了!在后面的采访中,Demis Hassabis 透露了 DeepMind 的下一步。

  DeepMind大败围棋界传奇李世石,引发了对人工智能的潜力的关注——热度远超近期的任何事件。但是Google下属的AlphaGo项目并不是它唯一的计划——甚至不是最主要的计划。就像Deep Mind联合创始人Demis Hassabis在前几天说的那样,DeepMind想要“破解智能”,而关于如何达成这个目标,他有许多想法。

  Hassabis自己走的并不是寻常路,不过现在回顾起来似乎是最有意义的路。他小时候是一个象棋天才,在脑力奥林匹克运动会上5次获得Pentamind冠军,随后在不大的年龄就与英国电脑游戏开发工作室Bullfrog和Lionhead一起闯出了声名,致力于开发偏重AI的游戏(比如《主题公园(ThemePark)》和《黑与白(Black& White)》),之后他建立了自己的工作室Elixir。在2000年代中期,Hassabis离开了游戏行业,攻读神经科学Phd,并在之后的2010年联合创立了DeepMind。

  AlphaGo旗开得胜的第二天清早,Hassabis坐在了The Verge记者的面前。此刻,即使他的心思一点也没有留给媒体,也不会让人觉得奇怪。然而,他进入采访室时,言辞温和又让人愉快。他谈论了一会儿首尔四季酒店里闪耀的装潢,随后当一位Google发言人告诉他一夜之间韩国媒体界涌出了超过3300篇关于他的报道时,他看上去非常惊讶。“这简直难以置信,是吧?”他说道,“看着某种有点深奥的东西变得这么流行真是相当有趣。”

  除了AlphaGo,我们的访谈也聊到了视频游戏、次世代智能手机助手、DeepMind在Google中的角色、机器人、AI如何推动科研、以及其他的话题。深入——非常深度的谈话。

  | 围棋是人工智能的圣杯

  The Verge:对于不太懂AI或是围棋的人,你会如何谈论昨天发生的事引起的文化共鸣?

  Hassabis:我会有几件事想说。围棋一直以来都是完全信息博弈游戏(perfectinformation games)的巅峰。从可能性的角度来说,它比国际象棋复杂得多,所以在AI研究领域中它差不多算是圣杯,或者说重大挑战,特别是在“深蓝”(破解国际象棋)之后。你知道,虽然已经投入了很多努力,但我们还没有走到那么远的地方。蒙特卡洛树搜索在10年前是一个很大的创新,但是我觉得我们对AlphaGo做的是,引进了神经网络这种直觉层面的东西——如果你想这么称呼它的话——而直觉的确就是顶级围棋棋手间的差距。直播解棋时MichaelRedmond甚至一度难以点清目数,而他是一个职业九段!我对于这一点感到相当惊讶,这也向你显示了为围棋写一个评估函数(valuationfunction)是多么困难的一件事。

  The Verge:你有没有被AlphaGo的哪一步棋震惊到?

  Hassabis:当然。我们都惊呆了——我想李世石也是,从他的表情上来看——当AlphaGo在左侧落子深入李世石的领地时。我觉得这是相当出人意料的一步棋。

  The Verge:因为非常咄咄逼人?

  Hassabis:既咄咄逼人又胆大包天!并且,它是在用李世石的方式与他对弈。李世石以充满创造力的战斗方式而闻名,他也展示出了这一点,我们也预计到会有这样的情况发生。棋局一开始他就在整个棋盘上四处落子,没有真正停在哪一点经营局面。传统的围棋软件对于这种打法都不擅长,它们在局部计算上不算糟糕,但是当需要全局观的时候就不行了。

  The Verge:举办这些比赛,首先一个重要的目的是评估AlphaGo的能力,它能打赢还是会落败。你从昨天的比赛中看出了什么?

  Hassabis:我想,我们知道了我们沿着这个方向走到了超过——好吧,没有超过我们的预期,不过就像我们希望得那样远。我们原来告诉大家,我们觉得比赛的胜率五五开。我仍然觉得这可能是正确的说法,什么事都有可能发生,我也知道李世石再次面对AlphaGo的时候可能会采用不同的策略。所以我觉得结果会是非常有趣的。

  刚才说了AI的重要性,回答了你第一个问题。另一件我想说的重要的事情是AlphaGo和深蓝之间的区别。深蓝是一个人工打造的程序,程序员们从国际象棋大师那里获得信息、提炼出特定的规则和领悟,而我们为AlphaGO注入的是学习能力,随后它通过练习和研究学会围棋,这种做法更像人类。

  | 从游戏行业到 DeepMind

  The Verge:如果AlphaGo继续一路攻城略地,下一步会是什么——未来会不会有另一场AI参与游戏的赛事?

  Hassabis:我觉得对于完全信息博弈游戏来说,围棋已经是顶峰了。当然,还是有一些其它的顶尖围棋棋手可以让AlphaGo与之对弈的,但是游戏是没有了——无限制的扑克牌游戏非常困难,多人游戏有独特的挑战,因为它是一个不完全信息博弈游戏。然后,显而易见有许多视频游戏人类都玩得比计算机更好,比如《星际争霸》,另一个在韩国很火爆的游戏。策略游戏需要一种不完全信息世界中的高水平策略能力——这被称为“部分可观测”。对于围棋来说,显然你可以看到一切都显示在棋盘上,所以这让围棋对于计算机来说显得稍微简单了一点。

  The Verge:战胜《星际争霸》对你个人来说是一件让你感兴趣的事情吗?

  Hassabis:可能是吧。我们只对处在我们研究项目的主要轨迹上的东西感兴趣。所以DeepMind的目标不只是战胜游戏,虽然这的确很有趣也很让人兴奋。你知道,我个人很喜欢游戏,我曾经写过电脑游戏,但是这是因为它们作为测试平台来说非常有用,在这个平台上可以卸下我们对算法的想法、测试它们能做到什么地步;这是一种非常有效的方法。最终我们想要把这个东西用在重要的真实世界问题上。

  The Verge:1990年代后期,我在英国长大,从电脑杂志上看到你的名字与一些非常雄心勃勃的游戏联系在一起。后来当我第一次听说DeepMind、看到你的名字在里面的时候,我心想,“简直太配了”。你可以说说你是怎么从之前的游戏行业转到你现在做的事情上的吗?

  Hassabis:当然。像DeepMind这样的东西一直以来都是我的终极目标。我为此策划了超过20年,从某些方面来说。如果你回顾一下我做的一切,从最终我开始致力于AI研究来看,我的选择就变得非常清晰了。如果你很熟悉我在Bullfrog工作室的事情还有后来一些别的事,你就会知道,对于我所写的一切程序、我所参与的一切活动来说,AI是核心部分。显然PeterMolyneux(Bullfrog工作室的创始人之一)的游戏都是AI游戏。当我16还是17岁的时候,我在编写《主题公园》的程序,那对我来说是一段非常重要的时间,让我意识到了如果我们真的试图拓展AI的能力、它能强大到怎样的地步。我们卖出了数百万份《主题公园》的游戏,有那么多人都沉浸于玩这个游戏,这是因为游戏里的AI能够适应你玩游戏的方式、做出改变。我们在此基础上继续前进,我也试图在我接下来的游戏生涯中继续往这个方向开拓。后来我离开了游戏行业,回到学术圈和神经科学界,因为我在2000年代中期感到我们在AI研究方面已经做到了极限——当你还需要真的做出一款游戏的时候。AI研究难以继续深入,因为发行商们只想要游戏,是吧?

  The Verge:所以那时只是因为AI最显而易见的应用就是游戏吗?

  Hassabis:当然,我是这么觉得的,我也确实认为我们当时做的AI极为前沿、让人几乎难以相信。我觉得1990年代学术圈还没有什么动静,而这些新技术——神经网络、深度学习、强化学习——也还没有真正得到推广。所以事实上那时候最好的AI在游戏行业。那不是我们现在致力于研究的这种AI,它更像是有限状态机(finite-statemachines),但是相当复杂、也能自我适应。《黑与白》之类的游戏中有强化学习——我仍然觉得这是强化学习用在游戏中的最复杂的一个例子。但是,随后在2004年、2005年左右的时候,很明显游戏行业走的路线与90年代不同了——90年代时它非常有趣也非常有创造力,你可以想出任何主意、然后实现它。但它后来变得更多的是在依赖于画质、续作、还有FIFA足球游戏等等,不再那么有趣了——我在游戏方面做了我能做的一切,是时候为了DeepMind的建立而去收集不同的信息了。那就是神经科学。我想要从大脑如何解决问题中获得灵感,那么还有比攻读一个神经科学博士学位更好的方法吗?

  The Verge:这可能看上去是唾手可得的成果,不过如果你们现在将AI的进展应用到游戏上,会怎么样?

  Hassabis:我觉得应该会真的很惊人。最近EA有人联系过我…【渴望的语气】我们应该会做的。有那么多事情可以做!【笑声】使用这些技术是非常通用的,我很想要做这件事。但是有带宽的限制在,并且我们现在精力集中在医疗和推荐系统之类的方面上。不过可能到某个时间我们就会做这件事,制作一些智能的、有适应能力的AI对手,并且我觉得游戏开发者们也会喜欢这样的——不必再为每个游戏都开发新的AI——届时可能他们只需要通过他们的游戏训练出一个AI就好了。

  The Verge:我刚才想象了一下你在家打视频游戏,在NPC面前比我还要疲于奔命的样子。

  Hassabis:当然【笑声】是的,在MMG(大型多人游戏)和类似游戏里这总是让我很受挫。我从来没有真的为这些游戏着迷,因为NPC都太蠢了。他们没有记忆,不会改变,不理解上下文。我觉得如果有了这种可以学习的AI,游戏就完全上升到另一个层次了。

  | DeepMind 的下一步:医疗

标签: aiAlphaGo

推荐阅读
聚焦
关闭评论
原创策划

知读会

专访《马斯克传》作者

专访《马斯克传》作者

文斯介绍了他撰写这本书的经历、对马斯克本人的了解以及马斯克与乔布斯的对比。 [详细]

精彩图集

直击人机围棋大战第二局

直击人机围棋大战第二局

谷歌人工智能AlphaGo与韩国棋手的第二局比赛,AlphaGo再下一城,以总比分2:0领先李世石。 [详细]