【赛迪网讯】近日,IBM表示,期望在21世纪头十年结束之前,生产出能够自动理解多达20门语言,并能识别这些语言的各种语调变化、口音及上下文环境的机器。该机器还能丝毫不差地转录法律、医疗和法庭证词。这正是IBM把这项新计划称为“超人类语音识别”的原因所在。
该项目已于本年度启动,计划于2010年完成。IBM称,已经制定出了整个研制过程的阶 段性任务,而总体目标更加明确——使机器语音识别能力赶上并超越人类。很多年来,PC机及其更加小巧的后续产品(PDA和手机)就具备了听说功能,但是用户很少能够充分利用这些功能,这是因为还存在以下制约因素:
机器在理解口音、语调变化特别是谈话的上下文环境方面还有困难,英语对于机器来说尤其困难。另外,机器尚无法有效处理背景噪音。除此之外,技术越复杂越需要大量的实验和调整,比如:通过反复听同一段声音,机器的识别能力将大为改善。
在过去的一段时间里,基于语音识别技术的产品在市场上取得了一定的进展,被用于开展查号服务,以及安装在一些电子设备中,例如:移动电话、PDA、汽车仪表盘以及交互式电视等。
IDC预计,到2005年全球市场对电话语音处理设备的需求将达到35亿美元,为此,IBM、AT&T、朗讯和飞利浦等许多大公司都在争先恐后地进行语音识别技术研究。IBM公司的100位全职语音识别研究人员中有20名正在专门投入此项研究课题之中。他们正在着手进行音频-视频识别研究,这涉及计算机视觉技术的开发,以便改善语音识别的精确度。另一个研究重点是MALACH项目。在国家科学基金会的资助下,IBM正在和其他行业的研究人员并肩工作,试图破解长达10万小时的二战纳粹大屠杀幸存者的谈话录音,这些录音内容纷繁多变,充满各种方言,感情起伏,语调跌宕,还夹杂着各种不同语言。(责任编辑:Jane)
闪烁短信--时尚至爱 动感短信--最佳祝福
送祝福的话,给思念的人--新浪短信言语传情!
|