科大讯飞胡郁:从感知智能到认知智能

2015年03月22日17:11   新浪科技 微博    收藏本文     
胡郁胡郁

  新浪科技讯 北京时间3月22日下午消息,“新智能时代论坛”今日下午在北京机械工业出版社举行。科大讯飞高级副总裁、讯飞研究院院长胡郁作为演讲嘉宾应邀在会上做主题演讲,题目为《讯飞超脑——从感知智能到认知智能》。

  以下为胡郁演讲全文:

  大家讨论很激烈,让我们感觉很尴尬,高大上的问题讨论差不多了,讲技术细节这个场合又不合适。我是搞技术的人,怎么也得搞点文艺范,最近我看了人类发展的书,里应对我们静沙龙的讨论范畴。我的报告原来是感知智能到认知智能,超脑计划是实现的根源。最近产业界讨论非常热,我自己归纳总结一下是三个方面的问题,一个什么时候,一个是怎么样,一个是到哪。

  什么时候人工智能真正的实现革命性的突破,这个问题上有两派的观点,大家提到了我就长话短说,霍金,马斯克,他们认为人工智能很危险,我们警惕,可以看出他们是非常乐观的,而且认为人工智能有危险,霍金同志说搞宇航的人不要随便找别人,到太空中找别人,搞不好找来了就把我们灭了。马斯克想办法让我们在宇宙中可以飞得更远,对比下一页和在座的会更加相似,最后一副图是描述在座各位的,他们认为人工智能远不能达到进步的地步,还有很多工作要做。如果在公司干过会发现老板和下面做事的人想法是不一样的,老板认为能够实现,工程师会证明有这样那样的限制,还有很多的难度,实际的活是要这些人干的。老板提出规划就可以了。

  雷·库茨魏尔去年来到中国,他的奇点理论,不管是摩尔定律还是超摩尔定律看到的,我注意到如果没有量变,以色列的年轻人写了一本书,人类简历史从动物到上帝,人类是两百万年之前就在世界各地方有古人类了,欧洲和非洲,大家最近知道的考古,中国有山顶洞人,远谋人,最近的考古证明,所有的人来自非洲的智人,中国的蓝田人叫直立人,7万年前的时候,这波智人走到世界各地,他们把其他地方所有的人都给灭了,当时世界上有六种不同的,我们讲猿人,但是智人把大家灭了,200万年的过程中相安无事,7万年的时候给灭了,说明了那个时候人类智能有一个基点的,这就给神创论有一些考古上的发现了。

  我们回头看一下,这个点是很难预测的,真正的事情是在什么地方,如果我们相信所有的事情都是指数曲线的话,群里面有另外一个讨论的笑话,如果真的所有事情都按指数曲线来弄,飞机装几万都没有问题,汽车只用一克油就可以了,但是还有很多其他的限制,限制是有瓶颈线的,这些瓶颈线,做模式识别的人都知道,前面跑的比指数还快,最后会被限制住,问题就来了,基点会是在限制线之前达到还是之后达到,这个事情我认为是讨论没有太多的意义,我们只管做就行了。美国在基因里面投入30万美金,奥巴马政府号称要用40亿美金来推动,他们的目的主要是研究人脑本身的问题,但是其中一部分的科学家为了忽悠政府的经费,后面加了一个尾巴,讲我们如果搞定了,人工智能问题也能够解决,当然大家的侧重有不同,我知道最近的中国的脑计划里面也是把生命的脑和人工智能脑,不管是有意为之还是怎样的,就是放在一起。前面讲的不可忽略的事实,神经网络和脑的工作基本没有关系,只是结构上,如果从仿生的角度讲是最浅层的仿生,工作算法和人脑的工作机理没有什么联系的,这是在座的各位相信以人工神经网络为代表的大数据,知识描述体系实现,这是最近二三十年内可以实现的。有没有突破性的变化是没有人知道的,要等计划做了五到十年以后态度看到后效,我现在是坚信第二条道路是我们的症结。

  还有一个问题需要回答,就是Where,人工智能是广泛的,不能用一个点表示,1到N不同的点状态是不一样的,跟计算机比计算,比记忆,人类已经没有比的意义了,1996年,不知道在座的多少人知道现在我们人是怎么跟计算机相比的,弥补了计算和记忆的缺失以后,人类还是可以战胜电脑的,因为是有创新的,大家知道江苏卫视的一个节目,非常大脑,其中一个很有意思的,一百组色子,每个人摇出一个数,100个记下来,这对计算机来讲不是事,这个方面就没有必要比了。

  第二方面,如果从感知的角度讲,举个例子,一个动物,一个猫,一个狗,看到周围会避让,随着传感器,图象,语音识别,大数据的自动驾驶汽车出来了以后,这个问题计算机进步是非常快的,与人类的进展是非常接近的。真正人类和动物的差别,人类从猴子变成人,动物最大的差别,我认为是语言,语言可以产生知识,知识可以产生福尔摩斯的推理,从而能够学习。这个方面机器要达到的话是很弱的,现在还是相当弱的,语言的区分,也是人工智能最大的挑战,为什么这样说呢,再回头看一下智人,7万年前智人干掉了其他的五个人种,后来有人研究为什么智人能够把其他人干掉,因为他们当时有一个词,认知革命,人类历史上也有认知革命,才有农业革命,工业革命,信息革命,第一是认知革命,这个表非常有意思,河边有一个狮子,事实证明猴子也能发出这个声音,智人发出的要复杂得多,能够整合更多的团队,能够复杂的知道自己的周边的环境,还有一个很重要的能力就是八卦,大家知道女士的八卦能力比男人强,这是人类社会非常重要的,因为讨论的人际关系,使原来100个人构成的协作可以达到150人,1500人,最重要的是大家提到的,因为有了这些语言和知识以后,能够虚构,产生了很多想象出来的东西,比如说宗教,大家可以交流了,这是因为有这些秘密武器,也是这本书上说的,人类有认知的革命以后,才实现了突破,问题就是这样的,人工智能是不是也会有,也会需要有认知革命,大家讨论着人工智能是和人交流,人工智能自身之间要形成,有突破的话,他们之间怎么进行交流,怎么样才能行政宗教,他们也要有认知革命,这两位又出来了,我是拿他们做例子,治安员非常重要,这个方面是否导致人类的人工智能革命,我不知道,但是我相信如果要想人工智能革命这是跑不掉的一步。我们讯飞研究院做的基础,计算智能是让电脑能算,感知智能就是能听会写,认知智能是一个必要的条件,不一定是充分的条件,我们主要做感知智能和认知智能,语音识别和合成大家看出很多了认知智能大家接触很多了。

  我讲一点自然源的处理难度,感知智能,刚才几位老师说的,不管是图象识别,语音识别方面,最近这几年是连年的下降,错误率,所以性能是不断提高的,比如普通话,现在方言也能够识别的,原来是别人和机器之间的交流,人的讲话是比较标准的,几个人进行讨论,说话的自由度非常大,从原来的手写识别,到考卷上潦草的字迹是否可以处理得很好,也不见得。围绕实际的应用,我觉得我们做的时候已经是按照刚才杨强教授讲的,是围绕任务和功能做的,是我们人类原来可以做,或者是工作量比较大的我们简单和了。认知智能的目标,如果机器人能理解,会思考必须突破四个方面,语言理解,知识表示,联想推理和自主学习。大家觉得现在既然我们的深度神经网络加大数据已经在感知智能上有这么好的表现了,直接套过来就行了。这是很多人的想法,大家可以看到为什么深度神经网络有用,除了刚才讲的因为计算能力,数据上来了之后,有对应关系的,图象处理,象素到边界,部件到人脸有很多的层次,和深度的神经网络,信息表述是能够联结在一起,但是如果是一个自然语言呢?如果讲这句话,中国两会期间,我们判断是哪一类的,政治,还是社会的,层次没有那么多,不像原来的感知智能里面,刚才也提到了方式,不能直接套进去,因为当我们看到了两会这个字眼的时候,语意,语法,背景知识有很多的知识和概念,这些知识和概念不是直接表现的象素一样,是冰山下面大部分信息内容的来源,直接的深度神经网络是不一定非常好地能够处理问题,这种挑战下,我们需要在认知智能方面要发明出更多新的算法,刚才余凯提到各方面来讲,我们用一些深度神经网络,其实还不是端到端的做法,能够探索到现在的自然元处理的传统方面的统一水平,想超越是很难的。

  我们是传统的方法要做,跟一些大学合作,另外一方面人工智能的技术的,人工神经网络的自然元素突破是非常必要的,举个例子,看一下递进方式的推进。首先是用了神经网络以后,把我们的词可以变化,原来是离散的分布,现在是连续的分布,并且是地图的方式表现出来,之间的距离可以度量了,我们可以看到第一个进展是在托福试验里面的词,语意的分析,左边的表有很多的词,他们的意思要相近,大家觉得简单就搞一个近义词表就可以了,实际做的时候是没有近义词表的,是靠词和周边环境的距离来度量的。麦克论提出了一套方法,我们还可以提高,充分利用了深度神经网络的算法。这两句话我做了差不多一个半小时的或侧累坏了,我坐了一个半小时的作业累坏了,语意上不一样,翻译上是完全一样的。我们现在能够提高20%以上的语意上的正确率,而不是发音上。更难的问题,如果在篇章层面上,教学上有现实的问题,中学的作文,英语的作文,能不能进行批改,批改是需要很多的信息,远比刚才的复杂得多,包括长度,语意的表示,词汇的丰富程度,各方面的,我们现在做到一个程度,英语的四六级考试里面,和高考的作文里面现在可以做到一个跟人类专家相接近的,这展示了我们用这个技术可以做到一方面,真正的挑战在什么地方呢?大家认为评价人类智能,比如小孩,大家都是考过来的,高考到底能够考多少分?美国和日本在做能够通过高考的机器人,863有一个认知方面的专题,和30多个国家在一起做高考机器人,可能大家还没有概念。举个例子看一下,这道题说了祈年殿的高度是多少,提到了历史字眼,和朝代有关系,判断下面哪一个说法是对的,按照这个说法得理解这个朝代和历史之间的关系才能作出正确的判断,这不是传统的神经网络直接套用就可以得到的。更难的是读一段话以后,在自由和不自由的哲学问题上要做篇作文,这个挑战会更大。

  我们看完这些以后,我们认为如果讲让计算机最终能够产生认知革命的话,需要一个比较长的过程,但是我不太担心这件事情,因为刚才讲到人类坚持的一本书里面讲人类也会变化,今天我一开始讲我们的几个都凑齐了,一个是人类的基因工程可以不断的完善人类的自身,生化人的工程让人类得到了拓展,人类智能本身的认知革命能不能完成,我们有很多的方法可以进行对抗的,这点我还是非常乐观的。

  以下为观众提问:

  杨静:谁搞生化人。

  胡郁:这个书中有一大篇幅的生化人。

  提问:刚才说的在高考作文的时候,你们和专家的契合度达到百分之子九十几,不契合的是不是最好和最差的文章?

  胡郁:非常正确,因为那个地方比较难,将是工作的重点。

  扫一扫,一起坐看风云变幻。扫描下方二维码关注新浪科技官方微信(也可微信搜索:techsina或新浪科技)。

文章关键词: 新智能时代论坛讯飞超脑

分享到:
收藏  |  保存  |  打印  |  关闭

已收藏!

您可通过新浪首页(www.sina.com.cn)顶部 “我的收藏”, 查看所有收藏过的文章。

知道了

0
收藏成功 查看我的收藏
猜你喜欢

看过本文的人还看过