设为书签 Ctrl+D将本页面保存为书签,全面了解最新资讯,方便快捷。 您也可下载桌面快捷方式。点击下载 | 新浪科技 | 新浪首页 | 新浪导航

输了!柯洁首战告负AlphaGo,哈萨比斯:这不是人机大战

2017年05月23日 15:21    创事记 微博 作者: 量子位   

  欢迎关注“创事记”的微信订阅号:sinachuangshiji

文/唐旭 若朴 (来源:量子位ID: QbitAI)

19岁的柯洁输了。

围棋人机大战2.0版的第一场,双方交锋至第286手棋,执黑的柯洁以约四分之一子的微弱劣势,败给围棋人工智能程序AlphaGo。

全程记录

10:30,柯洁和代为AlphaGo落子的黄士杰博士落座。

10:31,两位选手猜先,柯洁执黑先行。

随后,柯洁在右上角落下第一子,耗时13秒。

AlphaGo在右下角落下第一子,耗时45秒。

柯洁的第一步也被解读为尊重对手。柯洁第二步下出“三三”。这是AlphaGo的常用下法。随后双方开始你来我往。总体而言,AlphaGo落子速度比柯洁明显要快。

第21手,柯洁提掉白棋一子。而AlphaGo第30手,则让柯洁眉头一紧。此时,现场讲评的华以刚和徐莹表示,这盘棋场面好看,而且有不少没见过的下法出现。

比赛中,柯洁有时会突然发笑,有时也会默默摇头。

AlphaGo落下第50手,此时从盘面看,白棋暂时领先18.5目(仅供参考)。而这个时候,柯洁的思考时间已经比AlphaGo多用了将近40分钟。

第54手,白棋下出一个断。现场讲解的华以刚表示,AlphaGo下棋的效率令人心烦,并认为这将是这盘棋的焦点之一。而柯洁也再次皱起眉头,小长考了很久。

柯洁用时一个小时后,常昊、张璇夫妇代替华以刚、徐莹在现场上台讲解。常昊、张璇上台之后,也再次讲解第54手的断,认为是一个出乎意料的“后中先”。

在国内棋手中,柯洁以下棋速度快著称。而今天柯洁用时约80分钟思考后,AlphaGo才用时约20分钟。双方的差距正在越拉越大。

97手!柯洁下出天马行空的一招。创新工场人工智能工程院副院长王咏刚评价说:“这分明就是两个AI在下棋!讲输赢仍然悲观,但柯洁在人类里足以封神!”

柯洁用时还剩1小时07分的时候,现场讲解的常昊和张璇判断战斗可能要进入官子阶段,而整个盘面柯洁比较辛苦。此时AlphaGo用时还剩2小时20分,大约领先14.5目(仅供参考)。

148手的出现,让观战的网友一阵惊呼,纷纷大呼不理解。

随着比赛的进行,柯洁的表情逐渐严峻了起来。或者用手撑在面部,或者抓住自己的头发,或者悄悄的摇摇头。与此同时,柯洁的耗时逐渐流逝。

柯洁时间还剩大约半个小时的时候,AlphaGo还有两个小时。行至第173手,明显双方都已经进入官子阶段。从盘面上看,如果AlphaGo不出错的话,黑棋的局势要差一点。

“这时可能要靠电力局的同志们了”,有网友笑侃。

在收官阶段,柯洁和AlphaGo相互步步紧逼,屡屡祭出强硬下法。下午2点06分,柯洁又开始一个小长考。

现场讲解的徐莹表示,收官阶段非常重要,她举例说以前的李昌镐经常依靠官子阶段的发挥,半目逆转局面。

192手之后,盘面上似乎已经没有重要的官子了。AlphaGo已经能够“心态平和”的落子了,华以刚表示这说明AI已经对盘面有了相当的自信。

华以刚判断,结果马上出来了。此时,柯洁还剩不到18分钟。

此时徐莹粗略点出白棋目数为:65+8,而华以刚点完黑棋的目数,判断黑棋贴不出7.5目。柯洁应该输棋无疑。

第247手,尽管柯洁落子有点犹豫,但他心里早已明白一切。

在最后细小的收官阶段,柯洁下棋如飞,而AlphaGo在看似不用想的时候,反而落子仍然非常谨慎。

单官阶段,柯洁一直坚持走完,没有轻易认输。

哈萨比斯:这不是人机大战

首日比赛之前,现场还举行了一个简短的开幕式。桐乡市委书记,国家体育总局棋牌中心主任、Alphabet执行董事长施密特、DeepMind创始人兼CEO哈萨比斯等先后致辞。

以下是量子位整理节选的部分发言。

△ 施密特施密特:

非常高兴回到中国,中国对我来说意义非凡。这是一个珍贵的机会,可以打造一个更美的世界。去年我在韩国就说,不管胜负如何,人性终将获胜。电脑有自己擅长的事情,人类有自己的专长。

我们处在人工智能的时代,我们相信这能打造更好的生活,我们所面临的各个领域都有很多未解之谜,科学家通过人工智能,可以做到更多的事情。

这是一个伟大的围棋赛事,天才的选手和团队与AlphaGo对战,可以认为是人机合作时代的开启。

非常感谢今天你们能允许我们来到这里。

△ 哈萨比斯哈萨比斯:

我对未来几天的比赛充满期待。我们非常感激中国围棋协会、体育总局、桐乡政府等帮助我们如期举行人机大战。柯洁是一个真正的艺术家,天才式的围棋选手。这场对弈将开启围棋界的下法新天地。

这次峰会的宗旨,是在世界最深奥、美丽的棋盘上,探索新的下法。可能再过一万年,我们也无法穷尽围棋的下法和定式。围棋变化繁多,非常神秘。

三年前,我们想也许人工智能有足够的能力下围棋。AlphaGo不是一个预编程的围棋程序,而是采用人类相似的方式进行学习。

一年半前,我们与樊麾进行对弈,现在樊麾也加入了我们。AlphaGo以人类无法想象的方式下围棋。一年前我们和李世乭进行了对局,我们也为之感叹。今年一月,我们给他取名“Master”,并在网上取得60连胜的成就。

这不是人机大战,而是人使用电脑发现新的奥秘和知识。和哈勃望远镜一样,探索宇宙,AlphaGo就是新的哈勃望远镜。

AlphaGo可以用在其他领域。我们相信在制药、医疗领域,都可以借由人工智能解决,帮助专家取得更大领域的突破。

希望通过未来与人类专家的合作,找到各种创新的方式。希望探索有新的创新,也希望AlphaGo在其他领域有新的突破。

最后我们想对围棋界表达深深的谢意,这已经超过我们最初的想象。希望能探索新的下法,我们最终的目的不是谁赢,因为最终的胜利属于人类。

我们希望在座的各位能一起探索围棋的真谛。我祝柯洁好运。

9时40分,柯洁上台参与活动,然后离场准备稍后的比赛。

决战前夜:柯洁不眠

昨晚23:15:44,柯洁在微博上发出《最后的对决》一文,字里行间都透露着这位少年天才的焦虑和骄傲。以下是《最后的对决》全文:

决战前夕,感慨万千…

在这个特殊的时间,我有些话想和热爱围棋、关注围棋、关注我的朋友们说:

无论输赢,这都将是我与人工智能最后的三盘对局

很多人可能会问为什么?

其实私底下我已经与朋友家人说了很多次这样的想法,现在的AI进步之快远超我们的想象。像国产的绝艺、日产的ZEN虽然和AIphago还有着较大差距,但已经表现出超强的实力了…我相信未来是属于人工智能的。

可它始终都是冷冰冰的机器,与人类相比,我感觉不到它对围棋的热情和热爱。对它而言…它的热情——也只不过是运转速度过快导致CPU发热罢了。

我会我用所有的热情去与它做最后的对决,不管面对再强大的对手——我也绝不会后退!至少这…最后一次…

拼尽全力后,无论结果…管他口中是是非非,来一首《沧海一声笑》..岂不美哉、快意?我淡然笑到…

不眠夜,且看且珍惜,请大家欣赏我最后的三盘人机大战。

相比于柯洁的心情复杂,阿法狗这边似乎显得颇为轻松。

DeepMind创始人兼CEO哈萨比斯,昨晚才抵达乌镇。而对于第二天一早就要打响的比赛,他的态度是:“我都等不及了”。

AlphaGo简介如何进行训练?

一直以来,围棋就被认为是传统游戏中对人工智能最具挑战性的项目。这不仅仅是因为围棋包含了庞大的搜索空间,更是因为对于落子位置的评估难度已远远超过了简单的启发式算法。

为了应对围棋的巨大复杂性,AlphaGo采用了一种新颖的机器学习技术,结合了监督学习和强化学习的优势。通过训练形成一个策略网络(policy network),将棋盘上的局势作为输入信息,并对所有可行的落子位置生成一个概率分布。

然后,训练出一个价值网络(value network)对自我对弈进行预测,以 -1(对手的绝对胜利)到1(AlphaGo的绝对胜利)的标准,预测所有可行落子位置的结果。

这两个网络自身都十分强大,而 AlphaGo将这两种网络整合进基于概率的蒙特卡罗树搜索(MCTS)中,实现了它真正的优势。最后,新版的AlphaGo产生大量自我对弈棋局,为下一代版本提供了训练数据,此过程循环往复。

如何决定落子?

在获取棋局信息后,AlphaGo会根据策略网络探索哪个位置同时具备高潜在价值和高可能性,进而决定最佳落子位置。

在分配的搜索时间结束时,模拟过程中被系统最频繁考察的位置将成为AlphaGo的最终选择。在经过先期的全盘探索和过程中对最佳落子的不断揣摩后,AlphaGo的搜索算法就能在其计算能力之上加入近似人类的直觉判断。

(声明:本文仅代表作者观点,不代表新浪网立场。)

文章关键词: AlphaGo AI

分享到:
保存   |   打印   |   关闭