不支持Flash

周富秋:让机器和人一样说话

http://www.sina.com.cn 2007年06月01日 17:15  ChinaByte

  天极ChinaByte6月1日(熊海燕)当你打电话的时候,常常听到“不在服务区,请您稍后再拨。”而这个声音不是真人发出来的,是机器合成的。而如何让机器和人一样说话,说得和人一样好,就是周富秋和他的海量智能计算团队所要做的事。而在日本,早在60年代就已经实现了这一目标。

  在中国,海量的竞争对手很少,周富秋欢迎更多的竞争对手加盟。海量所做的技术门槛高,能与其站在同一条线上的业界竞争者还仅限于科研院所。

  那是在2001年,当时在英特尔担任技术总监的周富秋在一次会议上,被一个小伙子拉着聊天,他说是海量公司的,当时周还不知道有这样一个公司,并没有在意,这个小伙子和他讲自然语言技术,讲语言的分词。周富秋一下就被吸引了,要知道分词对英文来讲容易得多,但对中文来讲,对一句话分词不同,往往可以创造除多种不同的意思,计算机对中文分词的理解准确率低一直是困扰业界的难题。

  解决中文分词技术难题一直是周的理想,现在却被这个年轻人开发出来了,而且失误几率很低。

  “当时,海量的投资人很少,我没有成为投资人,但我被邀请进入海量董事会挂了个董事的名。”

  之后的几年中,周富秋每年都有机会和海量的创始人见面。“他在技术上走得深,她太太在管理上也进步很大,每次见都发现他们有新的飞跃,我看到了海量的希望和前景,他们实现了我在美国没有实现的理想。在他创业的路上遇到过几次艰难的时候,海量都坚韧不拔地坚持过来,这点感动了我。

  这也是周加盟海量的原因。

  现在,周富秋正式加盟海量,担任海量智能计算中心主任一职。目前,海量智能计算中心在自然语言理解的深度和广度上,在企业领域是首屈一指的,在一些领域,海量提供的商业应用是独家的。例如,过去商务印书馆和中华书局编一个新词库需要十几年,利用海量的技术只需要几年。

  周富秋是1981年中国文革后第一批去美国的研究生,当时有600多人都去了美国。刚去美国的时候,美国高校对中国的硕士不认,周就在加利福尼亚读了第二个硕士,之后又读了克林顿乔治大学的博士,1987年参加工作。

  周富秋在第一个公司里一干就是8年,这8年对周的影响最大。“美国LEXIS-NEXIS公司是自然语言领域最好的公司,这个公司成功的关键点就是把美国所有的法律文件电子化,把世界上各国的知名报纸电子化。美国人打官司,两个律师辩护的成败关键要看对相关前例案件了解有多少,当时没有网络,这个公司提供计算机自动化的手段,给律师能提供200年来所有的案例。公司业绩飞速增长。”

  而当时的周富秋做“处理文档”的工作。“一个案例几十页,关键的词语隐藏在某个地方,我让他格式化,如美国人查案子,要找著名的法官,名字没有规范化,怎么通过不同的名字查出来。把所有类似的称谓都指向一个人,如比尔盖兹、微软CEO等的统一称谓。可以在中间寻找关键点。让新闻媒体都很快找到自己需要的东西。”

  在LEXIS-NEXIS工作期间,周富秋的研究领域集中在在线文本自然语言的理解、全文情报检索和对智能化的互联网信息挖掘等方面。

  之后,周加入英特尔的团队,负责英特尔总部的互联网络信息研究计划的制定和实施,后受总部委派,参与组建英特尔中国(北京)研究中心,担任技术总监兼自然语言计算部门高级经理。在短短三年内开发出极具创新价值的基于概念的互联网信息检索、自动文本摘要以及基于文本的视频信息检索三项系统产品,拥有8项专利。

  2002年,他在英特尔公司的事业蒸蒸日上,当时,

中兴通讯的老总找到他,双方谈了整整两个下午。他终于被说动。辞去了英特尔的工作,加盟中兴通讯,成为侯总副总裁级别的总经理助理。

  如果是80年代,他是说什么都不会回来的,但回来一看就不想走了。“中国的变化太大,你不知道她会用怎样的速度奔跑,你不知道错过祖国这样繁荣昌盛的发展阶段,你会有多懊恼。”

  自然语言处理是让机器认识人类的语言。让机器模拟人的语言和思维能力,完成语音识别的合成。

  周富秋一直以来具体的研究领域是机器文本的研究,就是通过程序编制,让计算机把文章看懂,能把两篇文章判断和分成。

  “机器擅长的是计算而不是思维。”

  周做机器的文档识别,而他的好朋友李开复过去是做机器语音识别的,并在人工智能软件开发上很好建树,但周对李开复最近的举动不苟同。至于是什么举动,周笑了笑没多说。

  周很佩服李开复在人工智能上的成就。“李开复在美国做语音识别,开拓了前端技术,实现了人机对话,最后机器能够战胜人,其中很多计算的方法是李开复研究出来的。”

爱问(iAsk.com)
不支持Flash