首页 新闻 体育 娱乐 游戏 邮箱 搜索 短信 聊天 点卡 天气 答疑 交友 导航
新浪首页 > 科技时代 > 业界 > 正文

虚拟天文台:对计算科学的一次挑战

http://www.sina.com.cn 2004年04月06日 17:27 互联网周刊

  如同IT界中反映计算能力随时间指数增长的摩尔定律一样,在过去的十几年中,天文学的数据收集能力也遵循着类似的规律,并引导天文学进入到数据富庶的时代,一个结合了基础研究与信息技术的虚拟天文台也随之诞生

  本刊记者 宋妍

服务器市场四强易位 张国荣风采依旧一周年
金犊奖玩创意最正点 AC-尼尔森互联网调查

  望远镜制造技术可以反映一个时代的工程技术所能达到的最高水平。由于许多崭新技术的引入,如主动光学技术、自适应光学技术、光干涉技术、薄镜面拼接技术,使观测设备的口径越来越大、技术越来越先进、观测效率也越来越高。如同IT界中反映计算能力随时间指数增长的摩尔定律一样,在过去十多年中,上述技术的进步使得天文学的数据收集能力也遵循着类似的规律。虽然光学望远镜的接收面积每二十五年增长一倍,但天文探测仪器上装备的CCD像素数每两年即可增长一倍。而天文观测也逐渐进入多波段时代,从射电到红外、光学和紫外,从X射线到伽马射线,综合利用多个波段的观测数据,就能得到有关天体的更全面的理解。

  如此巨大的数据产出,使天文学家第一次觉得数据多得用不了,天文学史上第一次出现了数据富庶的时代。如果可以整合和分析这些数据,让世界各地的天文学家都能访问和使用,那将对科学的发展起到非常积极的推动作用。

  另一方面,信息技术的发展正渗透到各个领域,同时改变着科学研究的思路和手段。高性能计算和互联网技术的快速发展,让不同地点间海量天文数据的交换和传输成为可能,于是在天文学界兴起了一个全新的研究项目,虚拟天文台(Virtual Observatory,简称VO),它正是一个基础研究和信息技术相互结合的典型代表。

  对计算科学的一次挑战

  如果说利用伽马射线、X射线、紫外、光学、红外和射电所得到的观测数据,通过适合的方法进行统一规范的整理、归档,便可以构成一个全波段的数字虚拟天空;根据用户要求获得某个天区的各类数据,就仿佛是在使用一架虚拟的天文望远镜;基于科学研究的需求开发出的功能强大的数据处理和分析工具相当于各种虚拟的探测设备。那么,虚拟的数字天空、虚拟的望远镜和虚拟的探测设备组成的便是一个独一无二的虚拟天文台。

  虚拟天文台的海量数据也为计算机科学的发展提出了挑战,比如,在伽马射线爆发被发现后的数秒中内,大部分的反应已经发生,这给文档存储的性能提出了很高的要求,而且每个文档都应该以兼容的格式组织和显示信息,各个文档之间也必须能够进行数据交换。这些现实的需求都为虚拟天文台的筹划和建设提出了许多难题:如何描述虚拟天文台的内容,以便科学家能够发现需要的信息?怎样从不同的文档中提取信息以提供位置透明的查询服务,并迅速到足以实现交互的程度?如何实现查询结果的图形化,才能让研究人员更方便的研究各项数据?什么样的算法可以实现自动的多维数据的研究?

  虚拟天文台的核心部分无疑将是数据管理系统。过去,在天文学领域已经建立了完备的体系来定义和管理数据,有专门的语言来定义数据结构并将这些数据结构分配到现有的数据管理系统中。但是,这些工具都是在单一环境中发展起来的,比如独立的公司、组织或者代理机构,开发出用来整合不同来源数据库的工具依然是目前最基本的也是最费时的工作。

  自1970年以来,硬件的性能每十年就会提高100倍,在软件方面也有同样值得瞩目的发展。从1985年至今,排序算法的性能以每年翻一番的速度增长,这些进步一部分归功于硬件性能的提升,另一部分则归功于并行排序算法的持续改进。将来,还会投入资金从事算法和数据结构的研究,以便提高数据存储、删除、搜索、组织和挖掘方面的性能。在数据搜索算法中,统计学方法处于核心地位,因此计算统计学领域的进步将成为关系到虚拟天文台能否成功运行的关键因素。

  统计和应用世界上所有的天文学文档,需要数据元、网络服务和分布式查询等多方面的技术,虽然这些研究工作已经开展了几十年,但就目前的水平来看,还不能或者只能勉强地满足虚拟天文台的技术需求,像管理PB(GB的一百万倍)级的数据并处理各个目标之间的关系这样的应用则需要全新的手段和算法。对此有两条路可走,一是投资研发拥有庞大内存的计算机以解决这类难题,另一条路则是寻找运行在计算机机群上的优化算法。

  网格计算的天然试验场

  可见,虽然虚拟天文台的功能在概念上已经有了明确的认识,但是具体到操作上却不得不面对规模庞大的计算量,这包括对不同结构的数据库的监测和整合、自动生成统计分析以及实现最终结果的图形化。即使上述功能完全实现,也依然需要科学家对最终结果进行细致的解释工作,他们的任务显然无法被虚拟天文台所取代。但虚拟天文台的参与确实可以提高数据的使用效率,也可以把科学家从繁复的数据管理和运算的负担中解放出来,让他们节省出时间投入到创造性的工作中去。

  在IT领域,网格计算一直是一个时髦的词汇。网格计算蕴涵着这样一条关键性概念—虚拟数据。它意味着与网格进行交互的应用既不必知道数据存储在哪里,也不用知道数据在哪里被处理。其实网格计算的确存在着实用价值,它可以建立起价格适中、性能卓越的分布式计算基础构架,可以让用户或者应用(比如虚拟天文台)将高度分布的运算资源、数据存储资源和网络资源集成为统一的系统。因此,网格计算技术也能很好地应用在虚拟天文台的项目中。

  同时,虚拟天文台也是检验网格计算的天然试验床,这源于天文数据自身的独特性。首先,天文数据很少有商业价值,相互之间不存在保密性的问题,非常适合进行国家或组织之间不同算法的比较研究实验。其次,世界上许多天文数据中心的数据存储量已经达到数TB,几年后将达到PB量级,这非常适合网格环境下海量数据的处理和数据挖掘算法的研究。第三,天文数据是真实而归档完好的数据并提供在线访问服务,图灵奖获得者Jim Gray博士称互联网是最好的望远镜,称虚拟天文台是世界口径的望远镜。第四,天文数据的内容和格式多种多样,具有足够的复杂度。

  天文学领域的全球协作

  1999年,美国国家科学院天文学及天体物理学发展规划委员会在题为“新千年的天文学和天体物理学”的未来十年发展规划中,把建立国家虚拟天文台(NVO)作为最优先的推荐项目。之后,各国天文学界迅速响应,纷纷提出了自己的虚拟天文台计划,比如欧洲南方天文台领导建立的天文学虚拟天文台(Astronomical Virtual Observatory );欧盟资助研究TB级数据流的传输技术,以应对将来更大口径望远镜等硬件设施的发展;英国政府出资进行的天文网格项目主要关注面向分布式数据的网格技术等。

  从国际天文界的眼光来看,这些计划之间存在着许多共同点:每个项目都在寻求数据密集型天文研究的出路,都在力图挖掘现有以及未来海量天文数据的潜力。这些项目的共同目标就是建立一个国际虚拟天文台(IVO)。2002年6月,国际虚拟天文台联盟(IVOA)成立,它的建立将为未来其它学科的全球协作提供宝贵的实践经验。2002年初,以中国科学院国家天文台为首的中国天文界提出建设“中国虚拟天文台(China-VO)”的设想。2002年10月,中国虚拟天文台成为国际虚拟天文台联盟成员,其研发工作已得到国际同行的认可。

  除了作为科研领域必不可少的工具之外,国际虚拟天文台也是向大众普及科学知识的优良场所。天文学对学生和天文爱好者充满了诱惑力,甚至年幼的儿童也可能被天文学激发起求知的兴趣,从而去了解相关的物理学、化学和数学知识,并在天文学的探索中理解各类学科的基本概念。现在,国际虚拟天文台可以被全球每个角落的群体访问,包括那些没有经济能力建造和运行大型观测设备的地区,这极大地促进了发展中国家和不发达地区的天文学研究。

  (感谢国家天文台“中国虚拟天文台”项目组负责人崔辰州对本文的支持)


评论】【推荐】【 】【打印】【关闭
 

 
新 闻 查 询
关键词一
关键词二
 

 发表评论: 匿名发表 新浪会员代号:  密码:
 



科技时代意见反馈留言板 电话:010-82628888-5488   欢迎批评指正

新浪简介 | About Sina | 广告服务 | 联系我们 | 招聘信息 | 网站律师 | SINA English | 会员注册 | 产品答疑

Copyright © 1996 - 2004 SINA Inc. All Rights Reserved

版权所有 新浪网