科大讯飞刘庆峰:通用AI刚起步 专业领域可超专业人士

科大讯飞刘庆峰:通用AI刚起步 专业领域可超专业人士
2019年08月29日 17:01 新浪科技

  新浪科技讯 8月29日下午消息,2019世界人工智能大会今日在上海开幕,在主论坛圆桌对话环节,科大讯飞股份有限公司董事长刘庆峰发表演讲。

  到底我们需要什么样的人工智能?刘庆峰认为,首先应该是阳光的、健康的,不仅改变世界,而且是建设美好世界的。另外,我们所需要的人工智能也应该是遵循基本的科技规律的,同时也是按照基本的商业原则和逻辑的,而不是那种冒进的,忽悠概念的人工智能。

  刘庆峰表示,其实今天的通用人工智能还刚刚开始起步,机器的常识推理甚至还没有达到6岁孩子的水平。但是只要在专业领域有足够的数据,有规律可循的方面,机器又可以超过普通专业人士。

  此外,他指出,关于人工智能最新发展的判断,不要去做无效的辩论,要有科学的标志,科大讯飞提出判断人工智能红利兑现的三项标准:有没有真实可见的实际应用案例;有没有能规模化推广的对应产品;有没有可用统计数据证明的应用成效。(雪梅)

  以下为刘庆峰演讲全文:

  刚才给大家秀的是一个变声技术,因为刚刚IBM大中华区的董事长说他的声音哑了。我觉得以后这种变声技术就可以帮大家变成各种想要的声音,也使我们的生活变得更加的轻松和愉快。我想这也是人工智能本来的目的之一。

  今天给大家分享的主题是拥抱人工智能红利时代的到来。

  在讲到拥抱这样一个红利之前,我们首先要看一下,到底我们需要什么样的人工智能?

  其实人工智能从1956年的概念提出来,到今天63年了,中国人工智能的国务院新一代规划提出已经两年时间。我们大家都在考虑这样一件事情:我想我们所需要的人工智能,首先应该是阳光的、健康的,不仅改变世界,而且是建设美好世界的。

  另外,我们所需要的人工智能也应该是遵循基本的科技规律的,同时也是按照基本的商业原则和逻辑的,而不是那种冒进的、忽悠概念的人工智能,对吧?这是我们今天所需要的人工智能。

  其实我们可以从科大讯飞的人工智能开放平台上的开发者数量,看到其中一部分端倪。

  2016年,科大讯飞平台上的开发团队数量是13万家,现在是105万家,增长了800%。而这个中间我们可以看到,继续保持高速增长的领域主要包括了教育、办公、商务、摄影和摄像等等。

  当然还有一些增长比较快,但是开发者数量已经开始放缓的,比如游戏、影视、出行等等。这个数据说明什么?说明快速增长,但是增速放缓,头部效应开始显现,行业开始逐步汇聚到几个主要方向,所以说正在涌入的开发者就会变少。

  而在教育、办公、商务和摄影、摄像领域,不仅是代表着未来很重要的方向,而且创业者依然有大量的机会,所以非常多的创新创业者涌入进来。 在上海现在一共有将近7万个开发团队,围绕科大讯飞的技术在做各种应用。

  在过去两年我们频繁的看到人工智能被某些机构和创业者变成是所谓“收割智商税”的概念,对吧?大家可以看到很多不靠谱的说法。 今天其实是通用人工智能才刚刚开始起步,机器的常识推理甚至还没有达到6岁孩子的水平。但是在有足够的数据,有规律可循的领域,机器又可以超过我们普通专业人士,甚至学习顶尖专家知识,超过90%的普通专业人士,这就是今天我们面对的现状。

  因此我想世界人工智能大会,通过交流和沟通,让科技界、产业界以及应用界和普通的公众更多地了解人工智能,对人工智能进行知识普及和合理预期,在当前时代就有非常重要的意义。 2019年大家在讨论说人工智能究竟是大潮退去、开始泡沫破灭,还是说真正的一个应用红利开始到来了?

  我觉得一个非常重要的标志就是,我们谈应用红利,一定要谈人工智能能不能落地。

  所谓概念和泡沫就是虚无缥缈。你说的好听,没法看得见摸得着。 今天我们认为人工智能不仅要看得见摸得着,还必须要有规模化应用。如果没有规模化应用,就不足以谈人工智能落地。

  因此,在今年年初,科大讯飞基于对人工智能最新发展的判断,不去做无效的辩论,不变成无原则的争论,要有一些科学的标准。

  我们今天认为这三项标准就是判断人工智能红利兑现的依据。

  第一, 能不能有看得见摸得着的真实应用案例,这些案例不是概念,是能看得见摸得着的。

  第二, 这样的案例到底是靠重金和人力所堆出来的面子工程、形象工程,还是说可以规模化推广的产品,这是非常关键。

  第三, 这些规模化的推广产品,不是因为你是人工智能,社会就会接受,一定要能够用统计数据证明它的应用成效,节约了多少成本、提高了多少的能力和效率,以及减少了多少的危险岗位等等。

  有了实际应用案例,有着规模化推广的产品,有了能用统计数据证明的应用成效,我认为人工智能的红利就开始到来。

  我非常高兴地告诉大家,我们在越来越多的领域可以看到,这三大标准开始可以实实在在的看得见摸得着。比如说我们在上海的“人工智能+司法”,一直希望人工智能能够推动社会的公平正义的红利。

  其实在上海的206人工智能刑事案件辅助审判系统自2017年启动以来,现在已经从当时的杀人案、盗窃案、非法集资案和电信诈骗4种刑事案件的试点,覆盖到102个常见罪名,而且在上海的公检法体系是常态化使用,可以很好的用人工智能防止冤假错案,因为可以发现证据的自相矛盾和证据链的缺失等等。

  今年的1月23号,在上海第1次进行人工智能的公开庭审,不仅在后台,在前台上所有的关心这件事情的老百姓、媒体朋友、法学专家都能到现场来听。现在已经累计公开庭审了三次,取得了极大的应用成效,所有人都能看得见摸得着。 这是我们讲的对司法的帮助。

  对教育,科大讯飞承建的国家发改委的教育大数据专项,与北师大共同承建,科大讯飞在专项中,统计了中国学生过去两年35亿次作业,我们发现有60%是无效重复作业。因为一个班的同学回家做的作业都是一样的,很多我们会做的作业回到家要重复去做,有一些学习相对靠后的同学,一晚上也不可能做出来的。给他这些难题只会打击他的自信心,浪费他的时间。老师想做因材施教,但是实在精力顾不过来。而有了AI技术,我们能够通过OCR自动的汇聚学生数据,通过认知智能判断,客观题及主观题,甚至作文都能够评分,比老师还准。然后用知识图谱推荐他应该学习的内容,已经在上千所学校使用。

  今年5月21号我们发布了科大讯飞学习机,现在短短的几个月时间,我们可以看到,平均用户中有将近一半的学生每天都在用。因为这是课堂外使用。而老师如果在课堂上几乎可以百分之九十几的活跃度。

  这个是拿回家作为老师作业之后的一个帮助,竟然有将近一半的同学每天在用,而且在同样知识点中,已经效率提升了286%, 这就是我们说的实实在在的应用成效。

  另外机器翻译已经累计提供了5亿次以上的翻译,覆盖了近200个国家和地区。在今年年初,又通过了CATTI全国翻译专业资格(水平)科研测试。

  应该说人工智能利用红利正在通过人机交互以及各个行业开始逐步到来。

  中间我们所需要的如何开放数据、如何打通算法和数据之间的衔接,形成刚需应用场景以及数据自我迭代驱动的典型的人工智能的应用状态。

  这种方式出来以后,将不仅推动人工智能在各个领域的落地,也会使得中国未来的产业升级在全球真正的具备了切实的领先优势。 当然有了这些应用红利的落地,其实核心的出发点还是核心技术的突破。因为人工智能跟互联网最大的不同就是人工智能是强技术的,不是光有点子有想法,敢于做商业模式创新,敢于贴钱就能做成功的。

  所以我非常希望跟大家分享的这两个超出我们预期的例子,一个就是翻译师资格考试,原本我们认为2019年的目标是机器达到专业八级,没想到率先完成了,为什么?因为我们算法中在机器的半监督学习训练中有着重大突破。

  第2个是在机器阅读理解中,我们在今年3月份,在全球所有的顶尖机构都参加的情况下,IBM、谷歌微软Facebook都参加的情况下,英文的机器阅读理解,科大讯飞在人类历史上首次,两项指标都超过了人类平均水平。这个就标志着机器阅读理解突破,以后认知智能在各个领域的落地就有了可能性。

  它可以看懂电子病历,从而全科医生成为可能,看懂卷宗,从而法官成为可能,看懂作文,从而机器作文评分成为可能。在一个又一个的领域,包括看懂我们的各种各样的文章,语意意图,从而翻译成为可能等等。

  当然还有一个非常重要的就是应用场景的开放。我觉得上海召开世界人工智能大会确实是众望所归,因为他在应用场景的开放和创新中,确实有很多开行业的先河。

  比如说中国第一个考试自动阅卷系统,在上海成功,现在也是全行业我们独一的超过人工阅卷的系统。

  第一家人工智能电信诈骗防范系统在上海开通,机器自动防止诈骗电话,及时判断准确率做到99.7%,远超人工,在上海率先成功。

  刑事案件的辅助审判以及脑科学和人工智能的结合,包括去年还第一次在上海外国语大学做了机器和同传译员现场PK的一个比赛,机器也获得了令人非常鼓舞的成果。

  今年的5月21号,也是在这个会场,科大讯飞年度产品发布会,我们的虚拟主播用英语、日语、韩语、西班牙语、俄罗斯语、藏语、维语一共8种语言全球直播。这也是人类历史上第一次科技公司的虚拟主播的多语种的发布,应该说很多东西我们在上海都有可能形成应用迭代之后的数据自我驱动和进化的趋势。

  最后还想再说今天人工智能,其实我们绝不仅仅是说规模应用就结束了,还有大量的基础性工作要做。深度神经网络是推动第三次人工智能浪潮的非常重要的核心驱动力。但是也面临着非常多的挑战,比如说所有训练基本上都需要大量的样本,所有训练都要用人工标记以后进行训练。

  针对很多问题,都必须在一个领域中进行大量数据的共性学习,如何持续突破?比如说深度神经网络的很多参数,是需要我们高水平的研发人员靠经验不断的去调,手动去调参数的。我们一个机器需要三年时间,如果机器人自动的通过算法突破自动调参,三年时间可以缩短到半年。

  而现在我们有很大的突破,深度神经网络需要大样本,比如说原来做一个机器翻译,5000小时的语料才能做,而在去年的IWSLT的国际比赛中,最新的端到端翻译200小时就能做一个语种。科大讯飞是全球遥遥领先的,比的是德语和英语的翻译,从大样本变成小样本,以及从全监督训练变成半监督训练,甚至无监督训练。

  原来我一个数据,比如说我们对外部词典的知识,在翻译中原来需要1亿平行句对的,现在可以节约10倍、1000万就可以。类似这样的算法突破,不断的创新,就可以使得人工智能在一个的细分领域,从原来可能需要花5~10亿的成本,需要3~5年的时间,变成需要三个月到5个月,只需要花几千万就可以落地一个行业,从而极大的推动人工智能为各行业的赋能。

  但是我在这里更想说的是,我们希望通过无监督学习,通过小数据,通过自动订餐,能够使得我们人工智能能够为每一个个人进行训练,从而实现人工智能时代人机耦合,让每一个人站在人工智能的肩膀之上,成为更强大的自己,而不是被人工智能机器所替代。

  所以我认为人工人机耦合才能代表人工智能最好的未来。不仅是帮助每个个人,我们也开始用人工智能做更多的社会公益,用科技帮助更多的人,这才是真正的人工智能红利。

  比如说AI的无障碍公益,我们已经帮助了50万听障的患者,听力有问题,他可以用眼睛看语音,因为我们用语音识别把它变成文字,他眼睛有问题,他可以用耳朵听文字,语音合成把文字念出来。同时我们也启动了方言保护计划, 不仅要保护中国方言,也要抢救全球方言。

  因此我们想说的是,科大讯飞的历史使命是让机器像人一样能听会说,能理解会思考,用人工智能建设美好世界。因此建设美好世界不是人工智能的使命,而是掌握了人工智能的人类的使命。 我觉得这是关键。

  在最后我特别期待着在这样一个技术进步、产业理解、社会伦理、人文和法律齐头并进的情况下,我们能用人工智能创造更美好的明天。

  有一首《童年》在这里送给大家。

  (合成音乐《童年》播放)

  大家知道刚刚在两周前,国际语音合成大赛英文的我们又是全球第一名,但这个是机器唱歌,不光是可以读文字,也可以唱歌了,给他一段旋律,你随便谱曲,随便谱文字,他可以直接唱出来。所以用这一段AI的唱歌合声送给大家,作为今天的结束语。

  另外最后一个小的tips给大家。我觉得人工智能要因爱而能,让人工智能能够服务建设美好世界。也要源于热爱做长期的源头技术创新。

  今天的演讲。讯飞听见系统实时的转写成文字还可以翻译出来。大家扫二维码就可以看到每一页PPT对应的文字,感兴趣点文字,就可以听到我们的原始的声音。我特别想说一句,因为我们基于最新的小样本和半监督学习,我们今天的机器翻译不仅是全自动翻译,而且互联网就本地一个小设备,直接做本地的离线翻译,这在业界是独一无二的。所以今年5月15号,联合国日内瓦总部正式下单,采购科大讯飞的听见设备,用在联合国的会议和转写翻译之中,因为能够满足保密场合的需要,不光是在这样一个小的设备,在这个会场上甚至一个小小的翻译机,也能做到几十种语言,就是因为算法最新的突破,我们期待着未来在源头技术创新和产业应用上,共同迎接人工智能红利时代的到来。谢谢大家。

新浪科技公众号
新浪科技公众号

“掌”握科技鲜闻 (微信搜索techsina或扫描左侧二维码关注)

创事记

科学探索

科学大家

苹果汇

众测

专题

官方微博

新浪科技 新浪数码 新浪手机 科学探索 苹果汇 新浪众测

公众号

新浪科技

新浪科技为你带来最新鲜的科技资讯

苹果汇

苹果汇为你带来最新鲜的苹果产品新闻

新浪众测

新酷产品第一时间免费试玩

新浪探索

提供最新的科学家新闻,精彩的震撼图片