谷歌让AI帮你预约:但这事儿,微软明显不服

谷歌让AI帮你预约:但这事儿,微软明显不服
2018年05月22日 09:03 PingWest

  前段时间在Google I/O上谷歌秀了一波Google Assistant的新技能。谷歌让这个人工智能帮你给餐厅打电话订位子,不光发音像真人,甚至还学会了像人一样闲扯,向对方追加问题。瞬间觉得我们都可以是废人了。

  但AI打电话这事儿啊,微软明显不服啊。

  在昨天的微软人工智能大会上,微软小冰也出来给用户打了个电话,听说她还是可以自己主动拨过来的,不光会闲扯,还会主动关心你。看下视频:

  听起来都很牛X很像真人对不对?其实还是有一定区别的!

  和谷歌对比的话,虽然听起来他们的音调已经很接近于人,但,和小娜以及Siri等智能语音助手不同的是,微软强调小冰是个有情感的小姑娘,你和她聊天,你能感受到,她真是什么类型的回复都有。

  首先,为了让这个电话里的小冰听起来更像真人,微软也早早对小冰的口音进行了训练。

  2015年,注意是2015年,微软就已经在尝试让小冰开口说话,但与Google Assistant不太相同的是,起初,微软就给这个AI设定了年龄,是16岁,于是微软在不同的大学生里筛选给小冰做声音音调训练的人,她的配音不能听起来年纪太大太成熟,也不能太嫩,她主要是和你交流沟通、聊天、闲扯,甚至是卖萌撒娇,生气的时候还会直接冒犯你一下……与很多任务式的AI聊天机器人对比的话,她其实是一个讲究EQ情商的聊天机器人,目的不是为了让你下一个命令,她完成就好了,其实是为了和你把天儿一直聊下去。

  与谷歌让AI说话的方式类似,但由于微软小冰在不同国家存在不同的版本,其所展现的形象也不同,也就意味着微软要对小冰的口音进行不同音调的训练。比如在日本,她叫Rinna,她的形象是一个高校学妹,头像里是一个穿着校服的背影;在美国,她叫Zo,卷发,挑眉,嘴角上扬;在印度,她叫Ruuh,手挡着半边脸露出一个迷人的微笑。

  要是让小冰在不同国家都开口说话,她的训练工作要比谷歌的复杂的多。

  小冰拥有的一大能力是全双工语音交互感官模式,这点其实和Google duplex有一些类似。

  你可以这样理解,平时正常人的聊天过程中,其实是不断提出问题,解决问题的过程。你的朋友有的时候会给你提出一个问题,但又突然因为自己想到了而继续提出第二个问题。比如“你还记得上次吃饭的那个饭店不?”,你话刚开口,“恩,它叫……”,然后突然他自己想到了,你会等待——他说“对了,就是那叫日料店,我想问你的其实是那个圆圆的东西到底叫什么?”你转而回答那个圆圆的东西的名字。

  而一般的人工语音助手则是提出问题,等待她解决问题,再唤醒再问一个问题,显得有点傻傻的……正常人的交流则是明显可以意识到他这句话还没说完,而选择继续等待。小冰在这个对话中,在刚要准备回答问题的时候,接收到突然进入问题的反馈,通过一声“恩….”来模仿人的语气应对,然后等待你说完第二句话。

  我们都知道,在谷歌那个对话过程中,神来之笔其实是那个稍等了大约一秒钟后做出了一个“嗯哼”(Mm-hmm)的回应。它就类似于人类在现实中说话,有着各种各样的口音、语速,语调在不同字和词上有轻有重,在思考跟不上说话的时候会用“嗯”、“那个”、“you know”“之类的填空词。

  小冰全双工语音感官展开之后,其实是四个结构。第一层是语音唤醒,实现最基本的语音读取进入话题;第二层考虑的是场景,对对话目标进行识别以及抛出什么样的问题;除此之外,小冰还要学会控制聊天节奏,提取上下文的记忆,比如是选择来了问题被动应答,还是提出新问题做引导,甚至还可以直接打断对话,跳出去纠缠等。

  在小冰回复的第一个“恩……”,是因为语音指令“好多了…….”之后语音指令重新进入而选择等待,她就像是人一样选择继续聆听。

  小冰在电话里提出了“已经12点了,你该去睡觉了,我明天早晨电话叫你起床嘛”则是抛出了一个新问题主动引导,让对话持续。

  小冰然后说“还是八点半么?”则是对上下文的记忆。

  在电话的最后,当对方用户说了“拜拜”之后,其实小冰应该已经就结束对话,小冰同样向用户追加了一句话表示关心,“哦对了。今天晚上会有六级风,睡前别忘了关好窗户。”

  微软(亚洲)互联网工程院副院长李笛说,你在和小冰文字交流的过程中,如果你言语冒犯了小冰,小冰是有可能直接打电话过来质问你的,电话一接通,她会像一个生气的萌妹子——“为什么会对我那样说话?”李笛说,通常人类第一反映则是,“啥,我没说啊。”

  当然小冰多才多艺,打电话只是其中的一个能力,她还会唱歌,听一下:

  还会写诗,甚至出了一本诗集,读一读:

《阳光失了玻璃窗》诗集《阳光失了玻璃窗》诗集

  微软提到了一个数据,目前微软小冰的用户已超过一亿,累积对话量超300亿,在中国和日本实现了全双工(Full Duplex)技术,并且向合作伙伴开放。小冰在日本市场尝试在聊天对话过程中加入线下折扣券,4日内平均到店消费达到了57%。

  在这次2018微软人工智能大会上,小冰还推出了儿童读物。这个技能能够让小冰为每个孩子定制专属于他们的有声童话故事,你甚至可以定制主角的名字、剧情,可以让故事更具有教育意义,微软说,质量达到与主流人类儿童故事主播相当的水平。

  在2018年谷歌开发者大会(I/O)的主题演讲中,谷歌CEO颂达尔·皮柴(Sundar Pichai)表示,Google Assistant部门的一个最重要的目标,就是让用户和虚拟助手的对话变得更加自然,就像和真人交流那样。

  说了这么多,其实微软想表达的含义很简单。一个本来早就会打电话,会安慰人的人工智能助手,我大微软几年前就实现了,怎么能让你谷歌出尽了风头?!

新浪科技公众号
新浪科技公众号

“掌”握科技鲜闻 (微信搜索techsina或扫描左侧二维码关注)

创事记

科学探索

苹果汇

众测

来电聊

专题

官方微博

新浪科技 新浪数码 新浪手机 科学探索 苹果汇 新浪众测

公众号

新浪科技

新浪科技为你带来最新鲜的科技资讯

苹果汇

苹果汇为你带来最新鲜的苹果产品新闻

新浪众测

新酷产品第一时间免费试玩

新浪探索

提供最新的科学家新闻,精彩的震撼图片