AI技术再寻突破口:多学科交叉与宽度学习

AI技术再寻突破口:多学科交叉与宽度学习
2018年12月12日 01:43 21世纪经济报道

  本报记者 骆轶琪 深圳报道

  12月7日举行的2018大湾区机器人与人工智能大会上,多名业内人士表示,业界正在寻找打开当前深度神经网络架构的突破口。

  12月11日,在接受21世纪经济报道记者的专访时,深醒科技创始人、首席科学家袁培江表示,依靠粗暴的数据驱动是有阈限的,当前深度学习的方法很快会遇到天花板。业界正在谋求算法数据可解释性、模型合理性的进一步探索。 “技术永远是基于一定概率,目前的深度学习是一个不能解释的‘黑盒子’,人和机器面对同一个东西表现的特征,所得出的结果是不同的。”他解释道。

  为此,越来越多的人开始挖掘深度神经网络架构之外的模式,中国自动化学会副理事长陈俊龙12月7日向记者介绍,今年初他提出一个新的架构:宽度学习系统的网络架构。按照目前的测试,其应用时耗费的神经元和所需速度是深度学习的“至少一半”。

  在从机械性学习走向“认知”乃至学会“推理”、并能够掌握“思考方式”的过程中,人工智能技术将涉及更多学科和更深层次领域的交融。同时,与应用的结合仍是其不可或缺的一环。

  突破算法“黑盒子”

  袁培江向记者指出,理论上机器学习掌握了所有存储在其中的数据,就可以达到100%准确度,但目前尚未达到。“准确率从90%到99.99%会发展很快,但到小数点精确到更后面时,技术瓶颈会越来越明显。”他表示。

  陈俊龙有同样的观点,他表示,“现在的人工智能是根据人设定和提供的架构来做,是机械智能。做到面部识别快速,算法快捷,是早期的基本AI应用。但对人的思维和动作认知,机器还没有这个能力。”

  他认为,在认知和感知层面,AI目前仍面对很多困难,至少要10-20年的摸索。

  再往后,更困难的是对脑科学方面的研究。这涉及研究人脑的思维机制,目标是教会机器学习和认识人类的思想。

  在2018大湾区机器人与人工智能大会上,德国汉堡大学教授张建伟也提到,当前的弱人工智能更多是将数据自下至上地递进学习。下一步机器学习要融合其他强人工智能的学习方法,包括融入自上而下的知识、全局化地优化、进化算法实现可泛化的学习等。

  因此,对深度神经网络架构逐渐显示出的技术迭代短板,令业内开始思考其他可替代性的架构模型。比如今年初,陈俊龙提出了宽度网络架构。

  他向21世纪经济报道记者解释道,宽度学习和深度学习网络架构,本质上是结构和算法的差别。据介绍,深度神经网络学习架构,是在结构固定以后才开始学习。那么此后学习期间如果出现不准确,就要重新设计网络、再学习一次。

  宽度则是设计好网络后,当面临学习不准确的情况,可以随时以横向的方式进行增量扩充,即通过增加神经元,以提高准确度。

  袁培江则强调,当前业界一种观点是,不能单纯做“黑盒子”,“我们会追求,对机器做出的判断这个过程既能够做得对,也能够说得清。这可能是一个发展的必然过程。”他向记者指出,接下来将探讨的方向包括,对于数据的可解释性,模型的合理性,将先验知识或者知识图库的结合等方面。否则深度学习模型很快会遇到天花板。举例来说,在医疗领域,很多种类的癌症识别率已经可以达到98%。但为什么达到这个水平并不知道,同时不同病种结果不同,所以要找到机器学习的机制,做好迁移学习;另外要摸清为什么能够做到这样的识别率。

  智能2.0时代的应用

  科研技术和行业应用落地永远是相辅相成的角色,在AI领域尤其如此。通过将往期应用经验交给机器学习,可以一定程度提升机器的识别效率和准确度。

  图灵机器人董事长俞志晨12月11日向记者分析道,随着技术的深化,应用方面正走在智能2.0向3.0进化的阶段。

  他指出,智能1.0时代更多表现在语音交互方式层面提供服务,在2.0时代将对语义理解有更大要求,并与视觉交互相融合。“现在我们对多模态交互方式的要求越来越高,至少每2-3年会有一个新阶段的跨越。”

  作为初创企业,图灵机器人的技术发展策略就是深挖一个主场景,即儿童市场。

  “我们发现一些近年比较火的基于软件的聊天机器人,在基础技术服务上已经出现发展瓶颈,现在的创新更多是在内容生成等层面,而不是底层技术。”俞志晨认为,儿童场景将高度依赖软硬件的结合,其发展空间会比纯互联网产品前景更宽。

  袁培江也向记者强调,创业企业首先讲求的是AI场景落地,即保持产业化的“火种”,此后当大量从业者涌入这个行业时,就要及时意识到发展的瓶颈在哪里。若无法持续解决痛点,产业迟早会陷入与如今VR行业同样的困境中。为此,深醒科技的策略是寻求更多合作落地,包括技术和应用两个层面。

  陈俊龙告诉记者,从目前的实验来看,其研究的宽度学习落地到应用中,与深度学习可以落地的应用场景并无差别。但由于宽度学习的增量学习速度加快,在同样准确度条件下,宽度学习架构的资源消耗(包括时间、神经元所需数目等)是深度学习的至少一半。

  “中国在AI应用上在世界范围内是绝对领先,但基础科学的早期算法都是源自国外的开源。这种情况下,我们是否能基于之前学过的东西,形成一套更重要的理论很重要。宽度学习只是其中一个算法学习。”陈俊龙如此指出。(编辑:黄锴)

新浪科技公众号
新浪科技公众号

“掌”握科技鲜闻 (微信搜索techsina或扫描左侧二维码关注)

创事记

科学探索

科学大家

苹果汇

众测

来电聊

专题

官方微博

新浪科技 新浪数码 新浪手机 科学探索 苹果汇 新浪众测

公众号

新浪科技

新浪科技为你带来最新鲜的科技资讯

苹果汇

苹果汇为你带来最新鲜的苹果产品新闻

新浪众测

新酷产品第一时间免费试玩

新浪探索

提供最新的科学家新闻,精彩的震撼图片