语音交互场景成极具潜力市场 搜狗人工智能新方向

2017年07月20日 01:23 每日经济新闻

微博 微信 空间

添加喜爱

  能动口解决的事何必动手?在人工智能概念如日中天的今天,语音技术几乎是目前唯一的人工智能表现形式。互联网女皇Mary Meeker也曾说,语音,是未来人机交互的终极形态。

  或许你还没有感觉到趋势的变化,但有人已经提前布局,各大科技巨头纷纷布局智能音箱,想让它成为家用科技产品的控制入口。可是这种“盛况”也忍不住让人产生疑问:音箱是语音交互的最理想场景吗?想要完成人工智能产品的落地,只有这条路是最优解吗?

  答案显然是否定的,最近搜狗新推出的产品功能,寻找出了一条全新的落地之路,欲重构导航场景。业内人士认为,搜狗智能副驾将地图数据和语音技术结合,进而将车内操控和车外服务深度连接,使得地图产品进入了“全语音”时代。推动了整个地图行业的技术革新,也无疑给整个人工智能技术应用的落地开拓出一个全新的发展方向。

  为什么人工智能的落地如此重要?

  是什么让人工智能突然热起来的?面对这个问题,几乎所有人无一例外地回答——“AlphaGo”。去年AlphaGo横空出世打败了李世石,其推动让整个行业快速了解什么是人工智能。

  然而AlphaGo只是Google的一个实验性加上公关式项目,在不同的场景之下,人工智能的实际应用又有着完全不同的实现难度和时间进度。但人工智能此轮产业浪潮的发展迄今已经经历了5年的时间,业内认为,当下资本热衷的人工智能基础软硬件和产品应用都已经进入高速发展期。

  按照过往的行业发展经验,产品落地孰先孰后,似乎并不是决定性的因素,可是目之所及,人工智能的产品落地,已经趋向白热化了。原因何在?

  这或许与人工智能的基因有关。多数投资者将它比喻成一个工具,甚至是一个过程。就像互联网一样,提供了一个全产业升级的技术工具——互联网的诞生让O2O、电商和消费升级成为了可能。而技术会落实到具体的应用之上,反复积累数据,不断完善应用模型,进而提升应用的效率。

  也正是这样的属性,使得人工智能又具备了另外一个特性。人工智能不同于以往的工具产品可以随意更换,对用户来说,如果接触到一个人工智能,那么就会迅速与之建立“情感联系”,因为这个人工智能最懂使用它的人,他们之间会有沟通。

  就好像搜狗地图中的智能副驾一样。它知道你想去哪里,知道你平时的驾驶习惯,知道你常走的路。它如此懂你,也就意味着这种联系一旦建立,只会不断加深,很难斩断。

  说得感性一点,各家互联网科技公司比拼的,就是谁的人工智能最先被用户“爱”上。工具可以有很多个,但“爱人”只会有一个。这就是人工智能必须尽快落地的原因。从这个角度看,搜狗的人工智能是借助地图的形态最先打入到了用户的日常生活中,比所有的竞争对手都快了一步。至于用户会不会爱上它,相信只有大家亲自用一下才会知道了。

  智能副驾:重构导航这件事

  虽然导航已经是非常成熟的软件功能,可是,搜狗所谓的“智能副驾”功能,和我们熟悉的导航已经非常不同了。

  搜狗智能副驾的最大特点,是在接入语音助手“汪仔”之后,它能够像一个真实的助手一样和驾驶者对话,可以真正意义上地解放驾驶者的双手和双眼。

  举个例子,当用户说出“我要去奥森”,搜狗智能副驾则会进一步交互“您是去奥林匹克森林公园南园还是北园?”当确定了南园或者北园之后,智能副驾就会规划出一个合适的路线,并且给出路径计算以及预计到达时间。

  在导航过程中,当用户问出“前面是否堵车”时,搜狗智能副驾也会给出前方是否为缓行路段的提示,如果用户临时更换地点,也可通过纯语音交互快速重新规划路线。而当用户问到“奥森附近是否有停车场”以及“是否有好吃的地方”时,智能副驾还会根据用户的需求推荐附近的停车场和餐厅,并且告知价格、距离等,通过智能分析对比反馈给用户最合适的选择。

  显然,搜狗地图智能副驾能够全语音完美支持各种车内垂直类场景对话,包括语音查地点并发起导航、语音设置途经点、语音设置路线、语音问路况、语音沿途搜、语音查周边以及语音操作地图等。

  而在流畅的交互体验背后,其实是复杂而完善的语音交互技术。对搜狗来说,语音技术完成了对地图软件的一次赋能,导航这一刚性需求被重新定义了,这在整个地图行业内还是绝无仅有的。但是,搜狗智能副驾所做的事情,并不仅仅是重构导航这么简单。

  搜狗地图负责人孔祥来介绍,此次搜狗地图率先在行业内实现了全程多轮语音交互这一重大突破,主要得益于搜狗优秀的语音识别、语义理解、智能纠错、智能搜索、意图分析等综合技术能力。

  “我们的优势是语音技术和地图的数据结构化全部是自有技术。我们对现有的POI数据做了深入的挖掘和整理,这种领域知识直接调某一个地图厂商的SDK是得不到的。”孔祥来表示,“我们也知道有一些集成商在试图做跟我们一样的工作,但是它们遇到了很大的困难。”

  他进一步介绍,搜狗每日2.4亿次的语音请求量,积累了大量的语音语料数据,尤其是在噪音环境和口音数据方面更是有着巨大的优势。正是这些优质的数据训练量,给搜狗带来了领先行业的语音识别技术。

  正是因为搜狗有自己的语音识别,有庞大的语义理解团队,有地图搜索、导航能力,后面还有大搜索的技术能力支持,使得智能副驾产品在车内能形成了搜狗的竞争优势,建立了领先的竞争壁垒。

  据了解,目前,搜狗地图针对地理位置专门优化后语音识别正确率已达97%,考虑到车内环境噪音可能会影响语音识别效果,搜狗地图还定制了车内环境降噪方案,包括风噪、回声、儿化音过滤以及语音纠错等功能,有效降低周围干扰,进一步提升识别率。

  而在语义分析、上下文理解等综合能力方面,搜狗地图也是独具优势,凭借其海量用户大数据和领先的人工智能技术,搜狗智能导航全程人机对话支持超过10万的语义网络,能够细分场景,精细、准确、可靠地处理对话需求,直达用户意图。

  用导航完成人工智能落地,可行吗?

  当下人工智能无疑是最受追捧的概念之一,几乎所有的顶尖互联网企业都在布局人工智能,但目前来看能够真正落地的应用却乏善可陈。

  从行业内看,亚马逊Echo的智能音箱模式是被模仿最多的发展路径,仅在中国国内,就已经有至少200家企业在制造类似的智能音箱产品,试图以此切入生活场景,培养初期的语音产品用户,完成产品落地。

  但是,无论是搜狗将汪仔整合在地图软件中,还是亚马逊将Alexa整合到智能音箱中,归根结底,大家都是希望检验产品技术、丰富数据并培养用户的使用习惯。而相比于亚马逊的Echo模式,搜狗用地图软件的方式切入,或许会有一些不一样的收获。

  最明显的就是,导航是刚性需求,但智能音箱并不是。这意味着,搜狗能够覆盖更多的有效用户,这对于语音交互技术前期的用户培养和数据积累来说,可以说是意义非凡的。因为,人工智能的基础是大数据,大数据的基础是云计算,在此基础上场景的反复应用对技术的提升有反向推动作用。

  业内投资人也不止一次地表示,如果企业所构想的应用场景还没准备好,或者场景使用不够频繁,对技术没有强烈需求的时候,产生不了数据无法反复修改计算模型,就是虚的。

  在此背景之下,地图产品完备成熟,但智能音箱行业仍有待检验。在Echo式产品的制造上,上下游的产业链及相关的售后服务都是企业必须跨过的障碍,这无形之中也在增加企业的难度和经营成本,更何况,硬件产品的迭代速度远比不上软件产品。软件产品显然更有优势。

  最后,从市场竞争的角度考虑,搜狗采用的模式几乎是一片蓝海。但对于国内200多家制造Echo式智能音箱的企业来说,产品哪怕上市,也面临着一场激烈厮杀。

  业内人士认为,搜狗地图智能副驾的发布不仅推动了整个地图行业的技术革新,也让语音交互成为地图领域一个全新的应用方向,使得智能语音技术步入了更大的服务空间。同时,搜狗地图智能副驾的推动也是搜狗深挖导航垂直领域打造功能型人工智能的全新尝试,这无疑为行业开拓出了一条人工智能落地新方向。

推荐阅读
聚焦
关闭评论