科技时代新浪首页 > 科技时代 > 互联网 > 正文

商业周刊:Google数字图书计划艰难前行


http://www.sina.com.cn 2005年12月23日 08:32 新浪科技

  导读:《商业周刊》北京时间12月23日发表分析文章指出,Google数字图书馆计划自提出以来遇到了一系列令实施者头疼的问题,比如版权保护和技术难题等,最近还有学者指出,扫描图书存在大量缺页和字迹模糊等不足,但Google表示,数字图书馆计划将在艰难中前行,所有困难很快将被克服。

  Google打算将成百上千万册图书扫描后搬上互联网,成为其搜索内容的一部分。该计
划从一提出就不乏赞扬和批评的声音。一些学者及图书馆行业人士对该计划大加赞扬,称可促进知识通过互联网在全球范围内的共享。得知Google扫描的图书包括受版权保护的内容后,图书作者和出版商却提高了警觉,甚至有作者和出版商将Google告上法庭。

  Google坚持推进其既定计划,其中包括扫描美国五所规模最大的大学的

图书馆藏书计划。除了版权引起 的法律障碍之外,该计划还遇到了一些技术难题,令Google及参与方颇感头疼。

  一些学者发现,Google最初的扫描图书错误百出,存在大量诸如字迹模糊、缺页和任意删减等情况。该计划的参与者斯坦福大学信息与开发系主任安德鲁-赫克维克(Andrew Herkovic)表示:“假如我们要为扫描和在线发布支付费用,或者提高技术标准,那么Google目前推出的在线图书将不会是这个样子。”

  对于扫描过程中的大量谬误,Google已开始采取措施。Google数字图书计划产品经理亚当-史密斯(Adam Smith)承认,在无版权图书的扫描过程中出现大量错误,但他同时强调,该计划的首要目标是将更多内容搬上互联网,而其中的问题待稍后再行解决,因为这是一个规模宏大的长期项目。

  搜索引擎专家指出,Google数字图书馆计划遭遇的上述挫折说明,实现这一计划使其搜索引擎在数百亿网页中轻松找到相关结果并不容易。Google踏入其它新领域的一系列举措也并不都一帆风顺,从商务搜索工具Froogle到社会网络站点Okrut都没有达到预期目标,在增加搜索结果方面所起的作用依然非常有限。

  Google数字图书馆的扫描书籍有两个来源:出版商和图书馆。从技术角度来说,出版商提供的图书扫描非常简单,要么拆页扫描,或者直接引入电子版,并且搜索入口以出版商的名称来明确标识,通常情况下用户看到的内容非常有限。然而来自图书馆书籍的扫描却有相当的难度,因为有大部分书是绝版书,不可能拆开分页扫描,并且很少有电子版。Google的工程师不愿透露他们所使用的方法,但据知情者称,图书被放置在一个V形的支架上,支架上面是两部高分辨率

数码相机。用夹子固定好书籍之后,操作人员每翻过一页就用脚踏板踩一下相机快门的传动装置,这样每扫描500页就需要30到60分钟时间,进展非常缓慢。这种扫描方法可以在扫描旧书是时达到最佳效果,在电脑上的显示也相当清晰,但与拆页扫描的内容相比,错误发生率更高。

  本来对于版权公开的图书来说,在线用户有权通读,但就Google目前提供的图书来看,有些图书的字迹模糊到难以辨认的程度,扫描歪歪斜斜或缺页的情况时有发生。

  数字图书计划还面临另一道障碍,即如何使图书搜索工具跟Web搜索工具一样便捷和高效。SearchEngineWatch.com网站新闻编辑盖里-普里斯(Gary Price)表示,与网页搜索相比,扫描图书的搜索更为困难。由于目前的Web搜索主要依据Web网页链接的关联度,而这在一本书之内是无法实现的,因为确定每页书的关联度是非常困难的,特别是今天用户已习惯于输入尽可能短的关键字进行搜索。

  到目前为止,Google进行的图书扫描还没有得到合作图书馆的充分肯定,尽管合作者非常欣赏Google员工的认真程度和对图书的爱护,但对整体扫描质量的评价并不高。(丁克)

发表评论

爱问(iAsk.com)



评论】【论坛】【收藏此页】【 】【多种方式看新闻】【下载点点通】【打印】【关闭




科技时代意见反馈留言板 电话:010-82628888-5595   欢迎批评指正

新浪简介 | About Sina | 广告服务 | 联系我们 | 招聘信息 | 网站律师 | SINA English | 会员注册 | 产品答疑

Copyright © 1996 - 2005 SINA Inc. All Rights Reserved

版权所有 新浪网