科技时代新浪首页 > 科技时代 > 科学探索 > 正文

我国汉字处理技术取得新进展


http://www.sina.com.cn 2004年11月09日 10:59 科学网

  本报北京11月8日讯 (实习记者熊鹃)近日,中科院自动化所北京汉王科技有限公司研制的“多字体大字符集汉字、表格识别方法与系统(汉王文本王4.5版)”在京通过专家鉴定。该项目在多字体大字符集简繁混排、中英文混排、表格的识别及复原方面取得重大突破。

  据了解,“多字体大字符集汉字、表格识别方法与系统”目前可以识别宋体、仿宋、楷体、魏碑、篆书等多种字体,并支持多种字体混排,可以识别简体GB2312-80的全部一、
二级汉字,繁体一级汉字和常用香港汉字等1万多汉字,工整字印刷体识别率已达到99%以上。此外,该系统能准确分析识别及精确复原表格,精确识别原版面格式,准确恢复文本原貌,导出ACDSee图文索引,实现图片快速检索,还具备可提取公文红色批注和红章的彩色图像分色技术,这些技术在国内外公开发表的文献中未见报道。

  据悉,该系统是汉王公司在十几年光学字符识别技术



评论】【推荐】【 】【打印】【下载点点通】【关闭
 

 
新 闻 查 询
关键词一
关键词二



彩 信 专 题
Twins
友谊第一乱世佳人
维他小子
多吃水果海底世界
有声有色
夏日狂哗依依不舍
 
 



科技时代意见反馈留言板 电话:010-82628888-5488   欢迎批评指正

新浪简介 | About Sina | 广告服务 | 联系我们 | 招聘信息 | 网站律师 | SINA English | 会员注册 | 产品答疑

Copyright © 1996 - 2004 SINA Inc. All Rights Reserved

版权所有 新浪网