科技时代新浪首页 > 科技时代 > 通讯与电讯 > 2006手机技术发展论坛专题 > 正文

图文:移动多媒体技术联盟副秘书长杨昆


http://www.sina.com.cn 2006年08月10日 18:15 新浪科技
科技时代_图文:移动多媒体技术联盟副秘书长杨昆
图为:移动多媒体技术联盟副秘书长杨昆。(骆磊 摄)
点击此处查看全部科技图片

  8月10日,2006移动多媒体技术联盟手机技术发展论坛在北京举行。本届论坛就如下问题展开研讨:手机电视技术标准,3G手机测试和认证标准,定制手机发展趋势,以及热点移动多媒体新技术和新业务的标准化工作。

  图为:移动多媒体技术联盟副秘书长杨昆。(骆磊 摄)

  以下为其演讲全文:

  移动多媒体技术联盟副秘书长杨昆:

  刚才就MIM发展情况做了一个详细介绍,而且也给我们讲述了一下目前两种主要的移动即时通讯技术发展情况和她小组对两个体系的看法以及研究计划,应该说即时通讯无论是移动网络还是互联网都是一种通讯方式,也是我们下一步研究方向之一。希望在座代表感兴趣的,可以跟我们小组取得联系。

  这个阶段之后我们有一个抽奖。

  下面由我介绍一下我负责的研究小组的项目进展情况。目前移动通讯的发展是整个通讯领发展最快的领域,由于3G新一代技术的部署,改善了我们移动通讯网络具有的通讯能力,这为我们的业务创新奠定了非常好的基础,用户多媒体的需求更加强烈。与这种应用需求配套的是移动终端也在升级改进,包括计算能力、处理能力、操作的智能化以及对娱乐的支持。移动要满足这方面的需求,尤其是多媒体的需求,必须实现对各种媒体形式的支持,包括语音图象数据。

  目前移动通讯终端中,实现多媒体内容的支持,大部分采用计算机处理的多媒体处理技术,但是这种采用并不是完全照搬计算机以及互联网上的多媒体技术,而是考虑到移动终端的移动的环境。应该说移动终端的多媒体技术已经成为现在整个移动通讯新业务发展的新技术之一。

  我们目前在日常生活中见到媒体形式是多方面的,包括文字、图象、声音等等。而这些文字、图象、视频、声音需要在我们通讯系统中表述,不是用原来的形式表示,而是用数字的信息表示,将呈现给大家。视觉、听觉上的形式表述出来。

  数字媒体可以进一步划分,划分为自然媒体和媒体,举一个简单例子,现在大家见到的FLASH和语音是合成媒体。合成媒体是一种新的形式,尤其在目前多媒体领域内,由于大量的虚拟服务的出现,自然媒体不能满足这一种需要。合成媒体非常重要,目前在国际上来讲,合成媒体应用成熟的是语音合成技术,在文本方面也有一些进展。国内目前在汉字技术显行技术和汉字字库方面有比较好的研究技术。

  这张图形象化的描述了两种媒体主要形式的差异性,一种叫自然媒体,是我们真正生活中的自然界中真实的媒体,把它转化成电信号。

  还有一种是合成媒体,比如我们现在看到越来越多的动画,合成语音,合成音乐等等。移动通信中的数字媒体可以用这张图描述一下,根据业务实现的策略要求,提出媒体使用需求,对媒体不同的形式进行准备。大家真正看到到的单一的文字、单一的语音在我们日常使用中会越来越少,复合型的媒体会越来越多,所以必须集成,集成之后到达每一个消费者。这里面有三个主要的研究方向,一个是声音合成,一个是矢量汉字,一个是移动矢量图形技术。我简单先说一下语音的合成。数字化处理之后语音可以分成两个类型,对自然界声音的取样,以及计算机合成的声音,而计算机合成的声音可以进一步细化。我们目前研究比较多的是合成语音。语音识别和语音合成这一个名词对大家来说并不陌生,而且在国内,在

清华大学和中科大也有很好的解决方案。其中语音合成技术里面有很多内容就属于媒体合成技术的范畴。语音合成技术从技术发展阶段来说可以分成三个层次:直接合成语音,从一个概念来合成语音,而对用户的意念的理解合成语音,第三种是非常智能化的,目前处在一个比较初级阶段,第一个阶段,解决的问题就是将文字直接转化为语音。

  这一张图给出了TTS示意图,首先要将文本进行分析和理解,然后分两个步骤来做,一个步骤是根据发音规矩和语音资源库对基本语速进行翻译,还有对整个文本的理解,对整个组句、组段的韵律进行控制,最终合成日常用户可以理解的语音。

  语音合成技术,因为不受自然环境的限制,使用有很多灵活性,在未来通信发展中,具有越来越大的优势,比如是信息播报,彩铃等等,我们已经能够看到。语音合成和语音识别之后,进一步开发出真正智能化,这也是我们一直试图解决的关键部分。除了服务广大普通用户之外,还可以为使用群体提供服务,已经有单位在这一方面进行尝试了。面向手机声音合成语音,会越来越广泛。国内基于

信息产业部成立了中文语音技术标准工作组,已经进行了相关的工作。

  第二个方面,我介绍一下对文本信息处理技术。计算机处理的文本,实际上每一个人都在使用,比如说WORD、EXCEL,他要基于一个特定字符集,每一个字符处理中都会组织起来,有一个上下关系的字符流,让它变成机器可以识别的。

  汉字是记录我们国家语言的一种文字,它跟英文不同。所以汉字在各种信息终端上,尤其是在流媒体终端上,对汉字处理远远比文字处理复杂。它有几个特点:

  首先是数量大,现在我们有7万多数字,还有使用形式复杂。现在在计算机选一下汉字的字种有很多种。而且字形复杂,同音字多,这是很多语言没有的特点。我们国家对汉字编码颁布过国际标准,这是存储的时候一种表述方面的规范,还没有涉及到汉字其他方面的处理的标准。应该来说,完整一个汉字计算机处理包括输入、存储和显示三个阶段。汉字输入技术目前以键盘输入为主,也包括一些手写技术。绝大部分是各大单位的私有的技术。而且对移动用户终端来说,更为重要的是输入方式,也是显示,因为输入仅仅是对字形拆解的理解,不需要更多的用移动咨询。而显示要通过手机中内存汉字字库来最终形成汉字。它是直接提高手机里面大量资源。现在常用汉字设计方式有两种,一种是点阵,一种是轮廓描述。现在的手机屏幕越来越大,对文字的要求越来越高。现在越来越像矢量汉字在转移。包括国内的一些公司都是用自己的产品。应该来说,汉字字库有几个基本要求,和普通的计算机有所不同,一个是对现实性能有所要求,最关键是要存储空间小。

  这是目前已经颁布的一些汉字标准。

  第三个部分,就是用矢量图形技术。数字图形可以根据来源分成这样几类。这一张是计算机合成的,如果会做处理的话,会相当的漂亮的。

  计算机动画制作过程是比较的负复杂,大家也知道这一个事情,大家从2G到3D图画,就是属于合成技术。手机上用得比较多的是SVGD技术。现在用与多媒体短信的服务,包括2G和2.5G。它通常和通常的SVG技术相比,优势很大,而且呢,可以用到很多应用上,包括卡通、FLASH上等等。目前我们研究组定义为研究方向并不是简单的处理研究的报告,也不是当成一种新的技术,而是对新的技术进行研究,分析、评价技术各种情况,形成相应技术产权共享。这是我们最终的目标。也就是说我们来推动国内产业发展,而不是说我本身拿出来一个和大家不一样的技术来。第一阶段重点是放在高阶技术方面。这是我们大概时间表。非常感谢大家!

发表评论

爱问(iAsk.com)



评论】【论坛】【收藏此页】【 】【多种方式看新闻】【下载点点通】【打印】【关闭




科技时代意见反馈留言板 电话:010-82628888-5595   欢迎批评指正

新浪简介 | About Sina | 广告服务 | 联系我们 | 招聘信息 | 网站律师 | SINA English | 会员注册 | 产品答疑

Copyright © 1996 - 2006 SINA Inc. All Rights Reserved

新浪公司 版权所有