海量智能计算支持教育 与华中科大达成合作 | ||||||||||||
---|---|---|---|---|---|---|---|---|---|---|---|---|
http://www.sina.com.cn 2005年04月07日 13:53 eNet硅谷动力 | ||||||||||||
【eNews消息】近日,领先的海量数据智能计算技术服务商海量公司(bjhailiang.com)与华中科技大学计算机学院达成合作,提供海量公司核心产品-《海量中文智能分词》用于支持该校在 “Internet网上信息的检索与分类技术”研究项目。 华中科技大学计算机学院副院长卢炎生教授表示,“Internet网上信息的检索与分类技术”研究项目涉及到中文网页内容的处理,分词是必不可少的基础工作,一直以来我们
华中科技大学“Internet网上信息的检索与分类技术”项目小组同学邹磊更兴奋的说:“自动识别人名地名等是分词算法中比较复杂的一面,但我们在实际使用中曾做过两次对比测试,发现海量公司分词软件的算法使用得不仅仅是单纯的词语匹配方法,且具有强大的语义分析功能。海量这个方面的表现相当出色!” 词是语言中承载语义的最小单位,西文的词与词之间有空格分隔,而中文的词与词之间没有分隔,因此计算机自动将中文的字序列正确地切分为词序列—自动分词就成为中文信息智能计算的基础,也是信息处理质量的关键。 早在建国初期,国家就投入了大量的人力物力研究中文分词技术。然而几十年过去了,中文分词准确率仍然在97%以下徘徊,而这3%的差误率便让很多中文信息智能处理的下一步工作无法开展。 北京海量在线总裁王革焰指出:“海量公司多年来致力于智能计算中文分词技术,更关心并支持中国教育行业在这一领域的研究,我们拥有完全自主知识产权的核心技术产品——中文智能分词基础件。目前该基础件准确率已达到99.5%,主要应用于信息检索、汉字的智能输入、中外文对译、中文校对、自动摘要、自动分类等。已成功应用于搜索引擎、知识管理系统、竞争情报、出版、媒体等许多行业。” 王革焰进一步表示,目前海量公司已在中文智能计算信息处理领域占据领导地位,但为了更好的推进中文信息处理的发展,海量在线公司将与全国大中院校、研究领域展开全面的合作,共同提高中文信息处理水平。 |