科技时代新浪首页 > 科技时代 > 滚动新闻 > 正文

浅谈大榭码头IT系统“5个9”可用性


http://www.sina.com.cn 2005年11月29日 09:52 新浪科技

  宁波大榭招商国际码头有限公司(以下简称大榭码头)位于浙江省宁波市大榭港区,地处中国海岸线中端,长江三角洲南翼,长江黄金海岸线的交汇点,位置优越,是国内外航运商进入中国长江三角洲及长江沿线地区的重要交通枢纽,也是国内货物运输出境的最佳入海点,通畅的高速公路网使它连结着绍兴、杭州、台州、温州等我国重要的小商品出口地。得天独厚的地理条件也使其成为了具有高效吞吐能力的深水港码头。项目总投资4亿美元,规划建设4个深水集装箱专用泊位,可同时停靠4条10万吨以上的船,设计存储量为240万吨,年吞
吐量达到280万-300万吨。

  作为宁波港的第五期开发

建设工程,大榭港区与宁波港北仑港区一起被列为国家2010年前的重点建设项目。为实现宁波港“到2010年基本建成国际深水枢纽港、集装箱远洋干线港和上海国际航运中心的深水外港”的总体发展目标,大榭港区在开发建设中始终瞄准国际一流水平,力求体现出大型化、专业化、现代化和国际化的水准。目前,第一个10万吨级泊位(360米)和35万平方米堆场已顺利完工,已于今年年五月投入试运营。据了解,第二个泊位(450米)计划于今年9月份投入使用;第三、四个泊位于2006年年底前建成并投入使用;码头所有工程计划于2007年年中全部竣工。

  IT可用必须达到5个9

  作为港口业务的重要组成部分,码头集装箱作业的

信息化程度对于加速港口车船周转、提高货运速度、降低整体运输成本等,发挥着至关重要的作用。集装箱作业牵涉到船舶进出港、集装箱装卸、集装箱运输、大型装卸机械控制、堆场计划、作业进度控制等一系列环节。从一个集装箱入港,到下船、运输、落场存放、最终再运输上船,伴随整个业务流程产生的数据多达几十条,而每天需要处理的数据记录更高达数万条。

  投资35.4亿人民币建成的码头项目,IT系统的维护人员只有7名,为了保障业务,IT系统必须要达到5个9的可用性标准。“如果核心生产IT系统瘫痪,集装箱无法进入闸口,集卡(装运集装箱的卡车)会排成长队,所有的码头装卸都会停止。每小时造成的经济损失可能会达到几百甚至几千万,而更为严重的是造成信誉损失,会损失客户,船不再停靠大榭码头。现在码头竞争激烈,各码头都靠更好的管理系统来赢得客户,如果哪个码头的系统总出问题,客户就不会再选择这个码头了。”大榭码头工程部副部长任智勇这样跟记者解释IT系统5个9可用性对于他们的重要性。

  这种情况下,刚刚建立完成的数据中心机房便成为了整个系统的支柱。据大榭码头工程部IT工程师张冉介绍,数据中心的建立花费了他们不少的心思。其中,服务器的选型就花了7个月的时间,不但对周边码头、港口进行了寻访,而且还与多方的专家一同探讨选型问题,光是相关资料就有厚厚的一叠。最终,大榭码头选择了HP 9000服务器和Cisco的网络设备,同时选择了招商局系统的码头专用

操作系统作为软件。“可以说,为了保证码头业务的持续运行,这一切的软件硬件全都是按照最高标准选择的。”张冉谈到。

  但是,选定了服务器和网络设备之后,一个新的问题又浮现在了任智勇的脑中——最好的设备堆在一起,是否就能够表明整个系统的可用性非常高呢?

  高可用设备=高可用系统?

  “我们有了非常好的服务器、非常好的网络设备,这些是不是就一定保证我们的系统能够达到所需要的99.999%的稳定性呢?”任智勇在接受记者采访时,向记者提出了他们思考了多次的问题。

  “最后,我们发现,设备可用性和系统可用性之间还有很大的差距,系统环境中还有很多关键点需要考虑。”任智勇告诉记者。这些关键点,便是网络关键物理基础设施——NCPI,也就是包含有电源、机柜、制冷、服务、管理等子系统在内的,支撑上层IT系统运行的基础设施。

  NCPI不是孤立地看待机房的各个部件,而是将其看成统一的整体,终极目标是着眼于由电力、空调、监控等关键子系统构成的IT微环境的建设。如果将整个网络环境看成一个盛水的木桶,UPS已经成为最高的一条木板。但要提高整体系统的可用性,也就是扩大整个木桶的盛水量,配电环节、电缆布线、机房热量管理、机架热量管理以及整个系统的管理等其他木板的高度也必须提高,而且要加强各木板之间的配合紧密程度。

  “你也许想不到,我们在进行这些机房物理基础设施的选型中,竟然花费了2个多月的时间。”张冉告诉记者。

  此前,在大榭码头的招标过程中共有近10家供应商前来投标,他们分别是专注于UPS、机柜、空调、布线等领域。“可以说,每一个供应商都是相应领域的专家,但是,如果把这些东西合到一起,能否起到1+1=2,甚至是大于2的效果呢?而且,我们今后IT岗位编制只有7个人,管理工作他们能应付得来吗?”针对这些问题,大榭码头的领导进行了多次的讨论。

  分开购买不同的产品进行组合,初期的投资成本要比购买整套解决方案便宜,但是,由于考虑到人员编制和系统的安全性,在经过几次讨论之后,大榭码头最终选择了基于NCPI标准的APC InfraStruXure(英飞集成系统)。

  整体方案简化管理

  作为一种集成了机架、制冷、电源、管理与维护的系统,InfraStruXure通过N+1冗余结构从电源本身保证了很高的供电可靠性,并且通过集成电力基础设施的设计避免了很多不可靠因素,从而大大提高了系统整体的可用性。同时,由于采用了模块化、预先设计标准组件的方法,InfraStruXure将基本电源和管理元件集成到一个灵活的、易于使用的标准模块中,帮助减少复杂的电源安装过程,保证了方案的高可靠性、高可管理性和易服务性。

  整体化解决方案让机房的管理更加简便,据了解,目前负责机房运行维护的人员只有1名,而且并不是专职于此,还要负责一些弱电项目的工作。据管理机房的工程师郑明先生介绍,平时他根本不用进到机房当中,所有的维护工作都在远程进行。说着,他打开了远程监控的屏幕,为记者作了进一步演示。

  由于选择了整体化的解决方案,机房的温度、湿度,机柜内部的温度,各UPS状态,甚至是每个机柜中插座的负载情况全都清晰地/显示在管理软件当中。如果出现问题,系统还会通过电子邮件等方式第一时间通知管理员。

  “以前,我们总是要在机房加班值班,现在,有权限的几个工作人员只需在家里通过浏览器就能进行远程监控,为我们降低了很多的工作量。”张冉谈到。

  双系统保障5个9

  大榭码头机房的另一大特色,是完全采用了从端到端的双路设计,充分保障了IT系统的电力供应。双电源模块设计大大提高系统的冗余性,正常状态下,两个电源模块起到负载均衡的效果,而当某一个模块损坏时,另外一个则负担起全部的工作。

  而这,也是在很多用户的机房里面都不曾见到的。“很多用户把两个电源模块连接到同一路UPS之上,一旦这路UPS出现问题,系统一样会瘫痪。”张冉告诉记者。

  在大榭码头的机房当中,记者看到两套UPS配电系统,分别连接到服务器的两个电源模块当中,做到了“彻底”的两路输入,将可能由停电造成的损失降到最低,同时大大减小了对精密IT仪器的冲击。据了解,以目前的配置,在断电无空调的情况下,机房能够运行两个小时。同时,码头还配有第三路供电输入,由其为空调供电后,大榭码头的机房还能再维持两个小时的运行。

  张冉也高兴地告诉记者:“系统上线以来,没有出现过任何的问题,一直保持着非常平稳的状态,相信一定能够达到5个9、甚至更高的系统可用性。”

发表评论

爱问(iAsk.com)



评论】【论坛】【收藏此页】【 】【多种方式看新闻】【下载点点通】【打印】【关闭




科技时代意见反馈留言板 电话:010-82628888-5595   欢迎批评指正

新浪简介 | About Sina | 广告服务 | 联系我们 | 招聘信息 | 网站律师 | SINA English | 会员注册 | 产品答疑

Copyright © 1996 - 2005 SINA Inc. All Rights Reserved

版权所有 新浪网