法国巴黎第六大学教授:让机器人学会与世界互动

2017年08月25日 15:38 新浪科技

微博 微信 空间

添加喜爱
法国巴黎第六大学教授,IEEE RAS 前主席 Raja Chatila法国巴黎第六大学教授,IEEE RAS 前主席 Raja Chatila

  新浪科技讯 8月25日消息,2017世界机器人大会在亦庄正式开幕,大会于8月23日至27日举行。本届世界机器人大会以“创新创业创造,迎接智能社会”为主题,大会,分为论坛、展览、比赛三部分。展览部分展出面积约5万平方米。全球机器人行业的领先企业携“明星”展品悉数亮相,展示了机器人行业产业链上下游各环节的最新技术应用,勾勒出一幅充满未来感的机器人世界图景。

  8月24日大会主论坛上,法国巴黎第六大学教授,IEEE RAS 前主席 Raja Chatila发表了“让机器人学会与世界互动”的主题演讲,以下为实录:

  Raja Chatila:能够来到世界机器人大会我感到非常荣幸,也很高兴能够与大家分享,并且和大家一块探索一些和人工智能相关的话题。

  什么是智能?我们生下来就有一些能力,包括内部的知识结构,这些能力会随着我们年岁的增长不断地增长,所以这里我想向大家传递的信息是智能就是这样一种能力,这种能力就是可以不断地学习和不断地获得新的技术,因此学习是智能发展的核心。如果我们看一下动物世界,这是孔雀学会打开一个相当复杂的锁,因为它是有一些记忆能力的,可以学习一些比较复杂的步骤,它有一些基础性的能力,然后通过条件的设置学会了一些新的技能,这一点对人类来说是很容易做到的。它是通过与物体进行不断的互动获得回馈,因此在几次尝试之后这个动物终于成功了。人类也比较习惯于和其他人类进行合作,所以这种智能是一种社会性的智能,也是基于与人的互动,我们是从小就开始学习这种技能,也会学会怎么和人进行互动,因为人们都有对社会行为的期待,而这些东西已经在我们的社会行为当中嵌入了。同时我们也从其它的物体当中学习,不一定要跟它们互动,而是有可能受到他们的引导,就是从其它的行为主体那里学习,其实对人类和高等灵长类动物来说都是很重要的,因为可以降低自主学习过程的复杂性。如果我们不是从老师或者同学那里学习,可能会花太多的时间去探索世界,因此这三个问题是相互联系的,通过互动学习了解环境,通过向别人学习来进行互动。

  下面谈一谈我们应该怎样向环境学习。

  人工智能和机器人的历史上,人们认为觉察是一种观察的过程,你看到了一些图像,然后对这些图像进行处理,也有数以百万计的图像得到了处理,处理之后被分类,然后就获得了一些相关的结果。但是我们不理解你看的是什么,你有几百万的关于瓶子的图片,但你可能还是不知道这个瓶子是什么。所以觉察并不仅仅是简单的观察过程,理解世界实际上是理解怎样在世界上行动,怎样在世界上做出决策,因此理解是需要你的感应中枢的相互作用或者互动。因此,你必须要有这种意义产生,不仅仅是这种互动,也不仅仅是观察,所以这样一种感应中枢是在觉察和行动之间的桥梁,这也是我们在做人工智能时候的一个出发点。因此我们应该同时发展觉察能力和技巧,有了这样一个过程,这个过程当中你会从这些自下而上的、从原材料的数据到你的觉察需要进行推理、决策和理解,但这并不是一个单向的过程,而是一个双向的过程,因为同时也理解到你用这些物体可以做什么,也就是说开发出一些内在的技巧,这些技巧原来是存在的,但是通过一些行动和行动的组合实现更加复杂的技巧组合,把它们结合在一起之后,整个过程是通过学习来实现的。

  这个过程当中你的行动会通过你的命令进入环境当中,同时也通过反馈信息了解这些行动产生的结果,感受到世界在你的行动之后发生了什么变化,然后就可以提取出来越来越复杂的有关物体的表征。所以这是一个循环,这个循环当中建立起了这样一种感应中枢的表征体系,可以对世界进行更加复杂的表征,也是更加抽象的表征,还可以对自己的行动进行更加复杂的表征,这是通过学习实现的一个过程,有些背后动机的进程会给你的学习的过程带来一些回馈。这样的双向表征的过程通常被我们称为Affordance,主要是指一个物体被觉察、被表征之后怎么打交道,还有产生联系的过程。这是七十年代的心理学当中提出来的,也就是我们或者任何其他的人类和环境进行互动,怎样减少你的觉察中的复杂性。这里有你的系统、觉察、行动,然后要把觉察和行动连接起来,同时对这些简单的物体从零开始去了解机器人可以怎么做,这些表征意味着之前是没有类似的模型,机器人必须要用这些物体来做实验,比如推一推、拉一拉,或者是操纵一下,反正是做一些实验探索可以对这些物体做什么。

  这个表征体系当中可以和觉察的系统结合起来,因为这是一个实验,就是最后会形成这样一个仿生的网络,这个网络会抓住概率性的关系,就是在结果、物体和行动之间的联系,物体、影响或者结果以及行动之间是我们世界的基本关系。

  我们可以向其他的人学习,为了能够和其他的人互动,我们也需要把其他的人变成一种模型。人类的脸部表情和感情之间是有关系的,所以我们要利用这种脸部表情教会机器人一些新的行动,但是脸部的表情是我们的一个非常流行的研究话题,也有很多相关的研究。大家知道它是和具体观察到的面部特征相联系的,体现了一些基本的情感,但是也不简单,因为我们会看到有些情感的组合,我们也需要对这些情感和脸部表情之间的关系进行进一步的探究。如果你只看到了脸部局部的表情,这也是一个学习的过程。我们有一个网络,这个网络得到了训练,可以基于一些数据对面部表情进行判断。我们怎样使用情感的表情培训机器人,和人进行互动的时候和他们分享共同的环境,刚出生的时候我们不知道怎么和别人分享空间,也不知道应该怎么移动,这些是需要学习的,也是我们让机器人来学习,就是让他们通过观察人类之间的互动学习。人们碰到的时候会有一定的速度,不会从这个人的背后走过去,而是会保持一定的距离。考虑到这样一些参数,我们就可以开发出一个学习的过程,这个过程当中机器人可以观察人们接近的方式,然后确定自己的移动,所以这个视频当中你可以看到机器人的移动总是尊重着这些人和人之间的交往基本的规则,所以这是一个非常简单的交往的规则。

  如果是一个人或者两个人没有问题,如果有很多人的话怎么办?在这种情况下机器人就需要从信息当中提取一些概念,包括群体的定义是什么。目前群体涉及到人和人之间的距离以及人的方向性的问题,比如左下角的图片当中有一群人在走路,但他们并不是真的在一起。定义一个群体实际上就是定义一种能量的功能,这些人之间有一种关联,如果机器人走进一个人群应该是不要影响到这个群体的存在,所以应该有一个能量距离。机器人会选择这样一种自然的、天然的距离,因为这是人们所做的事情,如果要加入一个群体的话你是这样做的,参加到了这个训练当中,但是又不会太大地影响整个群体,这个群体会得到重塑。我们可以考虑一群人或者两个人,然后给他们引导,让他们跟着它走,把他们引导到登机口。

  从其他人那里学习非常重要,可以减少自主学习的复杂性,环境非常复杂,必须要能够有更多类型的情况去熟悉,包括更多类型的数据不断地涌入,机器人的觉察系统也应该能够应对这种复杂性。一种方法就是让人去引导机器人、教会机器人。刚才我提到了学习一些技巧,但是这个学习过程是通过与人的互动来实现的,这种互动可能需要一些建模,就是这个互动是什么,然后机器人就可以得到引导,使用一些回馈系统以便完成任务,同时也能够改进和人类导师学习的效果,这是基于一个分类系统。要想做到这一点,你要理解机器人必须要知道什么是和人互动,因此和人进行互动的所有因素都要考虑到,比如自然语言处理,脸部表情、眼睛的角度,还有一些非言语的手势或者让别人去看什么的时候会有一个手指指示,也还能够认识其它的表征,以便能够综合起来判断应该采取什么样的行动。

  现在这个学习的过程就展现在视频当中了,机器人需要按下一个按钮,所以有三个不同颜色的按钮,和屏幕上颜色一样的按钮,所以老师说不是这个,然后用手指着哪一个是正确的按钮,所以这是一个学习过程。机器人看到了屏幕上的颜色就会认识到哪一个按钮他应该按,有意思的是,这是基于一个学习过程的,所以不仅仅是适用于三个眼色,更多的颜色也可以,但最重要的一点是因为机器人自己学会了,而且学会了和人互动,所以就有能力增加它的知识,并且能够继续从人类那里学习。

  最后总结一下:无论内部使用的是什么模型,智能是通过互动培养出来的,也就是和世界其他人或者教他东西的人互动出来的结果,所以这也是理解能力是如何培养出来的,还是通过世界和人的互动得出的结果。

推荐阅读
聚焦
关闭评论