语音识别之后唇语识别兴起 面临怎样的市场空间

2017年06月29日 16:38 飞象网

微博 微信 空间

添加喜爱

人工智能技术方兴未艾。在大数据分析、云计算等基础上已经发展起来众多的实际应用技术,比如人脸识别、图像识别、语音识别等等,不断挑战着人们对科技的新认知。最近,另一种应用技术——唇语识别技术,让人们看到人工智能又给人们开了一扇窗。

据介绍,唇语识别技术,简单地说即终端设备通过大数据技术,捕捉说话时的嘴部动作,来解读说话人所要表达的内容。其最直接的现实应用场景就是,帮助听力、发音障碍者实现与他人的顺畅交流。

其实早在2003年,英特尔公司就曾推出一款名叫视听说识别系统的软件,电脑开发者可以在此基础上研制读懂“唇语”的计算机。而国外技术最纯熟的当属谷歌,其旗下公司Deepmind AI系统的唇语识别正确率在去年已经达到46.8%。

在国内,BAT这些互联网巨头虽未涉足这一领域,但也有一些创新公司在唇语识别技术方面取得了突破。6月20日,《重庆新闻联播》节目就用长达两分多钟的时间,对海云数据的唇语识别技术进行了报道。据报道,该公司唇语识别技术的中文识别率已高达71%,英文识别率达到80%,一度超过了谷歌Deepmind去年的成绩。

唇语识别将成人工智能研究新方向

人们总是对新鲜的事物保持着好奇心,因此比较成熟的唇语识别技术一经曝光就引发了广泛关注。

媒体曾对Google的唇语识别技术进行过多频次、长篇幅的报道,并预测了这项技术的应用场景。比如,可以在嘈杂的环境中向手机发送文字信息,对无声电影进行配音等等。

据介绍,在刚刚结束的2017数博会上,海云数据唇语识别技术与海尔、360等企业的技术一起入选“数博会2017十大黑科技”,引发国内大数据、人工智能行业从业者的广泛兴趣。中国媒体还将唇语识别技术和武侠小说中的“唇读术”相提并论,为该技术平添了一层神秘色彩。

目前,全世界涉及唇语识别技术研发的企业除了英特尔、谷歌、海云数据之外,还有微软。早在2011年,欧洲游戏媒体就声称微软第二代Kinect体感外设非常强悍,足以“读懂”唇语,还能够检测玩家的愤怒情绪。除了企业,研究唇语识别的还有一些机构,比如英国东英吉利大学等。

据了解,此前各企业和机构对于唇读有不同的称呼,比如lipreading(唇读)、speechreading(视话),visualhearing(视觉来听),hearingbyeye(用眼来听)等,但技术思维理念是一致的。

有分析人士认为,在人工智能即将大范围落地的前夜,唇语识别技术虽然相比其他技术冷僻一些,但也让业内看到了新的方向,相信今后会有更多的公司进入这个领域。

唇语识别当前应用场景相当广阔

基于唇语识别技术开发的产品绝不是一个小众产品。海云数据创始人、CEO冯一村介绍说:“除公共安全领域外,唇语识别还可应用到移动支付、军事情报、残疾人教育等领域。”

比如在公共安全领域,遍布街头的摄像头为安全部门提供了大量的无声视频资料,利用唇语识别技术可以对拍摄到的违法分子的口型进行识别,进而获取有价值的侦查信息。这将是一个巨大的2B市场。

再比如以2C为主的移动支付领域,唇语识别技术也可为支付安全提供更大的保障。尤其是在军事情报领域,随着技术的发展,远距离获取情报获将成为可能。

来自牛津大学唇语技术研究LipNet团队的Yannis Assael说:“我们相信,机器唇语解读器有非常大的应用前景,比如改进助听器,公共场所的无声指令(Siri再也不必听到你的声音了),嘈杂环境下的语音识别等。”

有报道认为,人工智能未来将会出现一个数万亿美元的巨大市场,在面对具体乃至细碎的应用场景时,人工智能的细分程度势必如百年前的电力那般触角庞杂。广袤的嫁接空间意味着,从真实应用场景出发,人工智能领域会出现不少蓝海市场,被国内巨头忽视的唇语识别也是其中之一。

国内唇语识别市场有待深入挖掘

相较于国外唇语识别技术“多企争流”的情况,在国内研发该项技术的企业少之又少——在BAT等纷纷布局眼下大热的图像识别、语音识别、人脸识别、无人驾驶技术的大背景下,仅仅有海云数据少数创新公司在该项技术上进行了布局并初步形成研究成果。

究其原因,其一是人工智能细分领域纷繁复杂,这些巨头不可能事无巨细面面俱到;其二是图像识别、语音识别等技术相对成熟,可以较快地投入市场,在逐利的驱使下,肯定要首先进军这些领域。不过,这也从侧面帮助像海云数据这样的创新公司在BAT巨头未涉足的领域获得站稳脚跟的机会,甚至是提前建立起技术壁垒。

业内人士认为,唇语识别虽还未迎来爆发的阶段,但网上随处可见、海量的视频资源已经为其做好大数据方面的准备,随着技术的不断进步,这项技术与将获得越来越快速的发展。

数据显示,DeepMind与牛津大学的研究者使用总长超过5000小时的节目对人工智能唇语识别系统进行训练,正确率已经达到46.8%,比专业读唇人士高出了大概3倍。而海云数据以长达1万多小时的新闻素材为“语料”模板,将中文的识别率提升到了71%。“未来随着‘语料’越来越多,识别率也将稳步提升。”冯一村介绍说。

技术的不断进步也将推动市场的深入挖掘。目前,唇语识别还没有到商用的地步(一般识别率高于95%即可达到商用标准),但随着技术的不断进步和识别率的提升,唇语识别市场或将迎来爆发,其对应的安防、军事、支付等行业也将发生巨大的变化。

推荐阅读
聚焦
关闭评论