科技时代新浪首页 > 科技时代 > 互联网 > 微软副总裁李开复闪电加盟Google专题 > 正文

it99:借李开复加盟GOOGLE 谈信息服务智能化


http://www.sina.com.cn 2005年07月20日 13:19 新浪IT业界论坛

  作者:it99

  Google日前宣布,原微软全球副总裁李开复加盟Google,担任Google中国区总裁,而微软则在美起诉Google及李开复,称其违反了竞业禁止协议。以下评论选自新浪IT业界论坛,转载请注明出处。

  GOOGLE邀请李开复加盟,并将在中国建立产品工程研究院,显示出GOOGLE坚持以技术为主导,加强在人工智能、自然交互等方面的研发及应用。

  所谓的人工智能、自然交互,在搜索引擎上的应用,具体来说就是语音识别、自然语言理解等关键技术。李开复当年在卡内基梅大学读博的时候,就开创了语音识别的新方向,奠定了目前国际语音识别研究的技术基础。李博士在MS中国研究院以及MS美国总部,一直在研究相关的技术和应用。相信他这次加盟GOOGLE以及领导GOOGLE中国产品工程研究院,也会继续朝这个方向努力,进一步推动搜索引擎的智能化、人性化和个性化,让更多的用户可以随时随地、随口随心地使用搜索,包括目前大家所熟悉的互联网搜索,越来越热的手机搜索,以及未来的语音搜索,甚至更神奇的感知搜索等等。

  搜索是信息服务的一个重要分支,搜索引擎的智能化,将进一步推动网络信息服务的智能化,提供充分的方便满足人们对于信息的获取和交流。让所有的人能通过一切通信手段获得个性化的服务,这是比尔盖茨在1999年《未来之路》一书中所描述的美丽图画,那时GOOGLE才刚刚成立。而在2005年的这个时刻,照亮未来之路的火炬好像已经被GOOGLE从MS手中夺走,MS不可能不着急。至于在GOOGLE能否顺利地走向未来,那我们可以拭目以待。可以肯定的是,智能化的信息服务,将给大家未来的生活带来更多的方便,并让我们的世界更美好!

  以下是我在去年应《微电脑世界》之约,所写的一篇文章,和今天的话题有所关联,因此也放在这里给网友们交流,希望大家指教、批判!

  原文发于《微电脑世界》2004年第十期

  信息服务走向智能化

  一、 巨大的市场需求

  通过自然语言与计算机进行交流,获取合适的信息,得到满意的服务,是人们长期以来所追求的目标。自然语言理解技术的发展,让文本自动分类、智能搜索、信息提取、语言翻译、自动文摘、自动勘校、智能聊天等成为可能。

  自然语言理解技术还达不到像人一样的智能理解水平,但是只要划定具体的领域(例如天气、体育等简单信息查询,也可以是交友、购物、保健等宽泛的智能聊天和咨询等等),都能量身定做出具足够实用性的智能信息服务系统,自动理解客户用自然语言发出的相关领域的问题,信息查询变得更方便、快速和准确。

  2003年,以Microsoft、AOL、Yahoo、Google等公司纷纷提供智能聊天机器人和智能搜索等个性化的智能信息服务。国内腾讯、慧聪等信息服务商也及时把握国际潮流,推出类似的新业务,力争巩固并拓展更大的市场份额。

  信息服务市场全球性爆涨后,智能短信服务适逢其时,先后在法国和中国投入市场。2003年底,Orange 法国公司采用Dejima公司的技术,为法国的短信用户提供从餐饮到汽车维修等多达150类的智能信息查询业务。2004年4月,北京得意公司率先把中文自然语言理解技术与短信服务相结合,与拥有丰富生活信息资源的《精品购物指南》报社合作,提供北京餐饮智能短信查询,并将陆续开通更丰富和实用的智能信息服务。

  智能信息服务将带来全新的应用模式,能有效提高服务的质量和满意度,拓展信息服务的发展空间.它将成为下一代互联网的重要应用,并有可能带来信息服务产业的变革。某机构调查结果显示,2004年中国大陆短信市场将达到300亿元人民币,网络短信用户将达到2640万;到2007年,短信、网上聊天的市场规模将达1500亿元。而智能信息服务的市场份额预计将达10%,也就是超过150亿人民币。

  三、 支撑技术

  计算机技术和人工智能技术的发展,是智能信息服务的广泛应用和日益普及的基础,自然语言理解技术是智能信息服务的支撑平台。

  自然语言理解技术最早地研究领域是机器翻译.早期所开发的机译系统的技术水平较低,不能满足实际应用.到了20世纪70年代初期,对语言理解对话系统的研究取得进展.进入20世纪80年代之后,机器学习研究又活跃起来,出现了许多较高水平的实用化系统.

  两大技术方向

  现阶段的自然语言理解技术有两大研究方向,分别是基于规则的分析方法, 即所谓的"理性主义";以及方针对大规模语料库的分析法,即所谓的"经验主义".前者基本上掌握了单个句子的分析技术,但是还很难覆盖全面的语音现象,特别是对于整个段落或篇章的理解还无从下手.后者充分利用计算机的高速处理能力和海量存储,收集大量相关的文本建立语料库.语料库提供的知识是用概率统计表示的,因而常常会出现答非所问的情况,并且语料库需要耗费大量的时间和资源去建立、维护,成本很高.将来,这两个技术方向将相互取长补短,呈现融合的发展趋势.

  为了实现智能信息服务的种种功能,人们在开发自然语言的词法分析、句法分析、语义分析、语境分析等技术,不断积累诸如电子词典、语料库等语言数据资源。

  优良系统的追求目标

  自然语言理解系统要具备好的适用性,应该支持上下文相关分析、话题自由变换、人机混合主导以及口语对话等特点.

  上下文相关分析是指系统在理解当前语句时可以联想用户以前所说的话进行综合分析,因此即使有时用户所说的话有一定的省略,系统同样可以理解。

  话题自由变换时指允许用户在多个话题之间不断转换,系统同样可以记住以前的谈话内容。例如用户在问航班起飞时间时,突然插入目的地与本地的时差问题,然后在继续关于该航班的问题,系统都能回答。而目前的一些系统,往往只能局限于某一个话题,一旦用户变换话题,系统将无所适从。

  人机混合主导则是完全的自然对话,用户可以转换话题后再回到原来的话题(像人一样);用户可以"答非机问"(多回答或少回答);而系统都可以根据实际情况提取语义信息,如果用户询问中的信息足够丰富,那么系统直接回答问题;如果用户询问的信息不全或者用户迟疑太久,那么系统则主动询问来获取足够的信息。而不具备人机混合主导性能的系统只能等用户发问,如果用户根本不知道问什么,那么系统一直待机等待。

  口语对话是自然理解技术实现的难点,但也是应用系统适用性的关键点。口语中,人们的语言很随意,可以省略、更正、倒叙等等,这些口语现象是传统的单单基于词法分析的理解系统所难以解决的,而引入基于关键语义的技术却很好地解决。

  从目前的理论和技术现状看,通用的、高质量的自然语言处理系统,仍然是较长期的努力目标。但是针对某些特定应用的系统已经出现。

  自然语言很复杂,人类对自己理解语言的机制还不是很了解。要主计算机理解自然语言,必须先将人是如何学习和理解语言的机制研究透彻。对此,需要计算机技术与语言学进行交叉学科的研究。

  研究现状

  国外在1963年就建成了早期的自然语言理解系统,许多著名的大学和科研机构都投入了大量的科技资源进行研发。IBM、Microsoft等公司先后推出各种基于自然语言理解技术的产品和应用,在英语、法语等语种上积累了大量的经验和成功案例。20世纪90年代,IBM、Microsoft先后在我国建立研究院,开展中文语言理解技术研究,其中一些新成果预计将在近期推向市场。

  中国在1980年建成了两个汉语自然语言理解模型,都以人机对话的方式来实现。目前清华大学、北京大学、北京语言大学、上海交大、复旦大学、中科大、中科院、社科院等主要科研单位都在自然语言理解技术方面有雄厚的技术力量。总体上看,国内外的自然语言理解技术方面的研究有一定的差距。当然,国内研究也有优势,语言工程所需要的大量专家水平的人力以及语言数据资源都是丰富的,价格相对低廉,目前有些系统取得了可观的经济效益。例如,华建集团的智能辅助翻译系统,是语言理解技术的出色应用;中文之星、紫光拼音等中文智能输入法引入中文语言模型,目前占有一定的市场份额;ChinaRen(现被搜狐并购)、慧聪等搜索引擎技术开发商也先后推出中文智能搜索引擎,力图在激烈的市场竞争中获得有利的地位;得意公司近日开通的智能短信服务系统,开辟出中文语言理解技术崭新的领域。

  前景展望

  人机交互的最高境界,是非常智能的信息服务。任何人、在任何时刻、在任何场所、在任何设备上,都可以通过自然语言和语音方便互相传递信息,随时随地进行交流。如图2

  不久的将来,我们可能会经常遇到这样的应用场景:一个人到一个新的城市(例如北京),若想尽快了解有关北京的生活服务信息,就可以用手机或者电话打到一个提供智能信息服务的系统。他可以直接用口语去问一个拥有海量信息的服务器:北京有哪些好玩的地方?哪些地方能够提供很好的餐饮服务?哪些地方可以购物?他还可以与系统进行人机对话,轻松地买机票、订房间等等。

  北京2008年奥运会将是智能信息服务大展拳脚的舞台,奥运会面临语言障碍。国内外产业界正在紧密合作,研制"面向奥运的多语言智能信息服务网络系统",力争在北京奥运期间为各国运动员、记者、观众,以及来自全世界数以百万计的旅游者提供综合、全面、多语种、可定制的智能信息服务。该系统将包括多语言信息同步发布、信息查询和语音交互式的电子商务,并重点提供基于位置的信息服务;另外还有口语翻译机和自动翻译电话等。

  中文的使用人数以及分布范围仅次于英语,因此中文语言理解和智能信息服务领域的发展空间很大,国内的社会各界也认识到中文信息处理的重要性,正在开展具有完全自主知识产权的技术研发,并积极引领相关的国际和国内技术标准,以争取产业发展的主动。(原文链接:在此点击)



评论】【收藏此页】【 】【多种方式看新闻】【下载点点通】【打印】【关闭

新 闻 查 询
关键词



科技时代意见反馈留言板 电话:010-82628888-5828   欢迎批评指正

新浪简介 | About Sina | 广告服务 | 联系我们 | 招聘信息 | 网站律师 | SINA English | 会员注册 | 产品答疑

Copyright © 1996 - 2005 SINA Inc. All Rights Reserved

版权所有 新浪网