万维网联合会提出下一代语音技术规范草案 | |||||||||
---|---|---|---|---|---|---|---|---|---|
http://www.sina.com.cn 2005年12月08日 10:25 eNet硅谷动力 | |||||||||
作者:王飞 【eNet硅谷动力消息】美国东部时间12月6日(北京时间12月7日)消息:万维网联合会(World Wide Web Consortium)在星期二宣布下一代VoiceXML将包括说话者验证的技术规范。
因特网标准制定团体万维网联合会称,它将提出VoiceXML3.0的技术规范草案,这项技术可以为用户在通过电话或者网络语音通讯进行商业谈判时提供话音识别校验服务。 VoiceXML技术常用于接受语音发出的命令而不是通过键盘输入的命令。许多商业公司利用这项技术改善了自动化处理,减少了员工数量,增加了公司效益。 但是由于发生了一些与此相关的安全被攻破的事件,现在用户和公司都越来越关注这些语音技术的安全性问题。 VoiceXML论坛新选出的主席Ken Rehor说:“说话者验证和识别并不只是电话传输与通讯安全的最佳生物测定方法,在VoiceXML技术中它还可以与语音识别和语音合成技术进行无缝合作。” 万维网联合会语音浏览工作组联合主席James Larson说,万维网联合会已经完成了VoiceXML 3.0所需的要求并且预计在明年第一季度末的时候制定出规范的工作草案。 除了VoiceXML3.0中的说话者识别的要求之外,万维网联合会还解决了将语音合成标注语言(Speech Synthesis Markup Language,SSML)的功能加入其他特定语言的问题,包括普通话、日语和韩语等。 语音合成标注语言的作用是帮助开发人员控制小段到大段话语中的各种时态。 Larson说:“汉语标签中将包括正确的发音音调以及词与词之间的发音停顿,以保证查找到正确的意义,并且让用户知道各个词语是从哪里开始到哪里结束。” 例如,普通话里的“mai”,即可以用来表示“猫”,也可以指“漂亮的”意思,具体的意义由发音的音调来决定。 Larson说,语音合成标注语言中的标签还可以协助语音合成器来识别非标准的单词发音。例如,“铝(aluminum)”在美国英语中只有一种发音,但是这同一个词在加拿大英语和英国英语中却有不同的发音。 Larson说,虽然语音合成标注语言已经是一种标准了,但是万维网联合会的语言扩充工作小组希望可以在明年三月召开第一次正式会议,拿出一个正式的关于语言扩充要求的规范性文件。 |