美日角逐超级计算机速度 日本是否仍能领先 | |||||||||
---|---|---|---|---|---|---|---|---|---|
http://www.sina.com.cn 2004年06月02日 11:36 ChinaByte | |||||||||
天极网 6月2日消息 竞争还没有结束。超级计算机对于高水平的科研是重要的。美国能够从日本手里夺回超级计算机的领先地位吗? 在两年多前,东京使华盛顿蒙羞。由日本政府资助研制的一台超级计算机胜过了美国运算能力最强大的超级计算机。事实上,日本名为“地球模拟器”的超级计算机的运算能力超过了美国最强大的20台超级计算机之和。
多年来,美国的一些超级计算机专家一直警告称,华盛顿对超级计算机的支持仅局限于五角大楼的核武器计划。尽管承认美国在软件方面的优势,他们警告说,美国的科研受到了影响,因为美国的超级计算机不是为了解决民用技术科研人员面临的严峻问题。由NEC公司研制的“地球模拟器”表明了美国在科学计算方面的落后程度。 能源部科学局的主管雷蒙德说,我震惊了。使雷蒙德和其它科学家震惊的不是“地球模拟器”原始速度,日本在1997年就表明了在这方面的目标,他们震惊的是其超级的效率,尤其是在进行气候或核聚变反应时。 5月12日,美国能源部部长亚伯拉罕公布了一项复兴计划。位于田纳西州的橡树岭国家实验室将建立一个面向公开科研活动的超级计算中心,它将由2、3台克雷公司研制的超级计算机组成。与这些庞然大物相比,“地球模拟器”也只是小巫见大巫。“地球模拟器”每秒钟能够完成41万亿次运算,用计算机产业的行话说,它的速度是41TFLOP。 橡树岭国家实验室计算业务方面的负责人托马斯说,他们的克雷超级计算机的运算能力在今年年底将达到40TFLOP,到2006年年初将达到100TFLOP,到2007年年末时将达到350TFLOP。他说,这样的运算能力将是提高竞争能力的新工具。与“地球模拟器”不同的是,橡树岭国家实验室的超级计算机将通过高速网络提供给远程用户使用,目前已经有包括航天、汽车、化学在内的多个产业表现出了很强的兴趣。 尽管研究恒星和生命起源的学术性科学家最需要超级计算机的运算能力,但超级计算机被广泛应用在各行各业,其中就包括金融、保险、半导体和电信。事实上,约一半儿的“超级计算机500强排行榜”上计算机系统都属于企业所有。 尽管目前企业使用的超级计算机不足以解决气候变化等“重大挑战性”问题,但它们在开发更好的产品和更快地在市场上推出新产品方面是至关重要的。宝洁公司甚至使用超级计算机设计婴儿尿布。 “地球模拟器”并非是唯一的威胁。在计算生物学━━利用软件解决从医疗诊断到药物研究在内的各种问题,美国有更大的障碍。在2001年,日本的理化研究院(Riken)就开发了一种专门用于模拟蛋白质作用的计算机,被称作“分子动态机器”的这种计算机的运行速度为78TFLOP,几乎是“地球模拟器”的二倍。 为什么Riken的专用计算机在2001年没有引起美国的恐怖呢?因为大多数分析人士都不大在意专用计算机,它们缺乏通用计算机的多功能性。但专家们也许应当换一种眼光来看问题。Riken计划于2006年年初推出速度更快的系统,其速度将达到1000TFLOP。Riken的生物计算团队的负责人MakotoTaiji说,尽管其主要任务仍然是探测蛋白质的结构,但他相信,它也可以用于纳米科技:一个原子一个原子地设计物质。 超级计算机设计有二种基本的方法。“地球模拟器”采用了所谓的向量架构,这意味关它使用了定制的硅处理器,这类处理器主要用于执行科学和工程设计中运算量比较大的任务;与此截然不同的是,所有的美国超级计算机都使用了普通的微处理器。在“地球模拟器”问世前,美国对这种设计“洋洋自得”,因为商业性处理器的销量大,比NEC公司的处理器要便宜得多。当需要更高的速度时,IBM、惠普、戴尔等厂商可以集成更多的处理器。12 但这种群集系统的峰值速度具有较大的欺骗性。当运行解决物理、化学、模拟汽车碰撞领域实际问题的复杂软件时,群集系统很少能够发挥相当于其峰值运算性能10%的性能。“地球模拟器”的效率在30%-60%之间。这种所谓的可持续性能方面的差异表明,“地球模拟器”的性能不仅仅只是美国最快的超级计算机ASCIQ的二倍。ASCIQ的峰值运算速度为20.5TFLOP。如果考虑到效率的因素,“地球模拟器”比后者的速度快6-20倍。而且“地球模拟器”使用的处理器数量更少,只有5120个;ASCIQ使用了8192个处理器。 对于企业中的大多数问题和核武器研制工作而言,群集系统是非常有效的,但在先进科研领域,向量软件代码将决定任务的完成时间。开拓新的科研领域可能会使用需要数天,甚至数年时间运算的应用。例如,在1990年代,期望搞清楚蛋白质工作原理的科学家往往要等上一年的时间才能够看到自己的计算结果。到1990年代末,性能达到TFLOP级别的超级计算机将这一时间缩短到了以天计。在Riken的78TFLOP的专用计算机上,进行这样的运算可能需要3-4个小时。在其未来1000TFLOP的计算机上,可能只需求3-4分钟就能够运行完毕同样的任务。 对性能更高的计算机的需求是无止境的。探索自然的奥秒就象剥洋葱那样:每剥掉一层都会生成更困难的问题。雷蒙德表示,目前,超级计算机已经成为科学发现必不可少的工具。科学未来的发展不会仅仅依赖于传统的理论和实验之间的相互影响。他说,模拟将成为第三种有力的工具。我是一名理论物理学家,有一些问题还没有任何理论,只能通过模拟理解相关的问题。 波音公司高性能计算部门的经理苏克拉表示,群集系统技术足以解决1995年遇到了重大科学问题,但目前最复杂的问题不能利用群集系统得到解决。但象“地球模拟器”这样的向量计算机价格昂贵,价格通常以亿美元计。对于期望节约投资的用户而言,群集系统是个很好的选择。代号为“大苹果”的超级计算机包含有1100台MacintoshG5计算机,从理论上说,它的运算能力为17.6TFLOP,相当于“地球模拟器”的45%,但二者的售价分别为520万美元和4亿美元。 群集系统带来的不仅仅是低价格。它们在“洞察力时间”的效率是不可计算的。由于没有自己的超级计算机,在等待使用美国国家科学基金会超级计算机中心的计算机时,他们往往需要等上一个月的时间,因此尽管使用了速度较低的计算机,他们的问题反而可能解决得更快。 IBM研究院负责探索性计算机系统的主管威廉姆说,还有另一个需要考虑的“洞察力时间”问题:开发应用程序所需要的问题。编写软件包时间通常比运行软件的时间要长。由于研究人员能够使用开发PC和工作站软件的工具开发所需要的软件,软件开发过程就会加快,就能够弥补运行时间方面的差异。 IBM公司负责“deep”计算项目的副总裁戴维说,至于群集系统的接受程度,数据最能够说明这一问题。自1990年代,群集系统一直在蚕食克雷型计算机在“超级计算机500”排行榜上的领地。到1994年,超过半数的超级计算机都属于群集系统,去年,这一比例更是上升到了95%。 戴维表示,计算机架构主要受到经济的影响。如果我明天推出一台足够快的系统,但它的售价高达5亿美元,这样它就只会有1、2个客户,这不是一种业务。克雷公司的CEO詹姆斯也承认戴维的这一观点,他说,这一市场不够大,不足以维持IBM、惠普等维持一种独立的向量芯片所需要的庞大研发费用。据IDC公司称,十多年来,全球顶级服务器的销售额每年都在10亿美元左右。 能源部负责机密研究的部门发现,群集系统具有不可抵抗的魅力。它于1995年启动了ASCI计划,开发性能由GFLOP级跃升至TFLOP级的超级计算机,该计划最顶端系统的性能将达到100TFLOP。IBM公司预计这台名为ASCIPurple的系统将于明年在劳伦斯-利弗莫尔国家实验室启动。 ASCIPurple的“王位”不会维持太长的时间。IBM和劳伦斯-利弗莫尔国家实验室还在开发一款名为BlueGene/L的更为强大的超级计算机系统,它的性能将高达360TFLOP。但威廉姆警告说,IBM公司还没有足够大的计算机验证象BlueGene这么复杂的系统设计。BlueGene系统将配置有131072个处理器。 如果一切正常,BlueGene可能预示着向新一代超级计算机过渡的开始━━这类系统集向量系统和群集系统的优点于一体。BlueGene系统的芯片使用了一个特别的“管道”增强性能。克雷公司已经与桑迪亚国家实验室合作开发了一种名为RedStorm的类似架构,第一款使用该架构、性能达到40TFLOP的系统将于明年夏季投入运行。 业界普遍认为,仅仅依靠向量处理不足以开发出解决新一代重大问题所需要的性能达到PTFLOP级别的超级计算机系统。解决这类问题的软件会非常庞大,其中会包含大量的群集系统能够有效处理的标量代码。托马斯相信,安装在橡树岭国家实验室的克雷公司的CrayX1超级计算机和RedStorm系统将提供有价值的方针。 五角大楼的先进计划研究局(DARPA)也正在资助开发使用向量/标量混合架构、性能达到PTFLOP级的系统。参与竞标的有三家公司:Sun、IBM、克雷,DARPA将对它们的方案进行评估,然后选择一家公司在2009年建造能够工作的原型产品。 日本也有类似的计划吗?日本也有学者提出了向量/标量混合架构,但苦于没有资金支持研究活动。但这并不意味着美国可以轻松一下了,因为NEC公司还在开发全新的超级计算机系统,但现在还没有公布详细的资料。 |