回顾中国信息产业20年:教电脑识中文 | |||||||||||
|---|---|---|---|---|---|---|---|---|---|---|---|
| http://www.sina.com.cn 2005年08月24日 18:59 中国计算机报 | |||||||||||
|
王立群 一个人的WPS 求伯君:1964年出生于浙江新昌县。 1989年成功开发国内第一套文字处理软件WPS; 1994年成立珠海金山电脑公司,任董事长兼总经理。
2000年任金山股份有限公司董事长至今 因为出生在浙江绍兴市管辖的新昌县城南公社西山大队,所以后来求伯君就以西山居士自称。让求伯君名满天下的不是他的雅号,而是WPS。 WPS由十几万行汇编语言程序构成。人们很难想象当年求伯君是在怎样的环境下开发出WPS的。求伯君回忆起当年自己单枪匹马编写WPS的时候,不无感慨。在当时的技术条件下,开发一款像WPS这样的文字处理软件,国外软件公司会组织数十位编程高手一起参与开发,而求伯君却是一个人,一台386电脑。从1988年5月到1989年9月,求伯君把自己关在深圳蔡屋围酒店501房间,几乎足不出户地埋头写程序,每天都写到凌晨两三点,足足吃了16个月的方便面。后来,求伯君回忆起当时自己的孤独,根本无法用语言表达。在编写WPS期间,求伯君三次大病,就是在患病期间,他也没有停止过编程。 这个集中文文字编辑、排版、打印功能于一体的中文文字处理软件很快风靡全球。WPS成为那个时候中国人共同拥有的财富,几乎每台电脑上都安装了WPS软件,几乎所有学校的计算机课和社会上形形色色的电脑培训班,都在教授WPS,无数人通过WPS走进电脑时代。求伯君的名字每天都呈现在数以万计的电脑屏幕上,他被媒体称为“中国第一程序员”。 从无到有从有到精 20世纪80年代初期,电脑涌入中国。电脑是会用了,可是怎么让计算机认出博大精深的汉字是一个难题。1966年,IBM公司的Casey和Nagy发表了第一篇关于印刷体汉字识别的论文。20世纪70年代以来,日本学者做了许多日文汉字识别工作。我国到了20世纪70年代末也开始进行汉字识别的研究。清华大学电子工程系智能图文研究室的师生坚信,汉字识别难题应由中国人自己来解决。 在20世纪80年代初,我们以贷款形式筹到5万元,买了一台IBM PC机,开始了文字识别的研究。当时没有扫描仪,就以传真机获取汉字文本的数字图像作为输入。1989年,我们的第一个TH-OCR科技鉴定成果推出时,受算法和硬件设备的制约,识别一个汉字需要两三秒的时间。原国家科委领导在肯定我们研究成果的同时,半开玩笑地说:“让计算机识字好是好,是不是速度有点太慢了,现在是2~3秒认一个字,你们什么时候能实现1秒认2~3个字啊?”带着这个目标,我们又开始了新一轮的研发,很快我们就实现了这个目标,并迅速在市场上推出TH-OCR软件产品,取得了收益,还了贷款。而随着识别技术的进一步成熟和计算机硬件速度的加快,我们研发的TH-OCR无论在识别速度还是准确性、稳健性上,都已经与初期的OCR不可同日而语。 1992年,文通公司在原国家科委的支持下,为推广“863高技术计划”TH-OCR汉字识别研究成果而成立。经过十余年的经营,文通公司不仅推出了名片识别系统、“慧视”摄像文字识别系统、“小灵鼠”文通手写识别系统等一系列适销产品,还利用TH-OCR技术,针对特定行业的应用需求和特点先后成功推出了包括e验通身份证识别系统、TH-OCR2003录入工厂、IT-Center数字化信息中心、工商年检表格识别系统、银行票据识别系统、增值税发票防伪税控系统等在内的OCR行业应用产品和解决方案,迅速占领了行业市场。 对 焦 随着计算机应用从纯科学计算转向应用领域,在中国,汉字信息处理就变成了一个亟待解决的瓶颈问题。但计算机是从外国传入的,他们不会考虑汉字处理的要求,因而使计算机处理汉字信息的任务只能由中国人自己来完成。 见证人 丁晓青: 1962年毕业于清华大学无线电电子学系,后一直从事模式识别方面的研究。她所提出的“模式识别统一熵理论”对模式识别系统的设计有重要的指导作用,现为清华大学电子工程系责任教授、博士生导师。
|







