科技时代新浪首页 > 科技时代 > 滚动新闻 > 正文

HP业务连续性/容灾解决方案介绍


http://www.sina.com.cn 2005年10月12日 07:41 新 浪 科 技

  

  随着各行业用户对网络应用及数据信息日益增加的依赖性,使得当局部的突发性灾难如地震,洪水,飓风,大火或者恐怖活动等事件发生时,造成整个公司的业务生产都将受到重大影响,最终会导致公司收入减少、利润降低以及失去客户。

  如何避免业务运转受到影响,或者使业务影响尽可能降到最低,这是每一个企业管理者必须考虑和重视的问题。如何切实有效的保障关键业务系统的连续运行已经成为企业管理层十分关注的问题。

  本方案涵盖了高可用的容灾系统平台的软硬件技术介绍、日常运作流程设计、突发事件管理和大型灾害的应对计划和策略、业务持续性管理团队建设和咨询等诸多方面的服务,可以帮助客户从技术、流程、人员三方面提高业务持续能力,保证企业IT系统的正常运作和发展。

  业务连续/容灾解决方案(Business Continuity / Disaster Recovery Solution)是惠普公司专为希望采用远程灾难恢复的方式来实现关键业务数据保护的企业用户而设计的,它通过惠普公司产品专家、业务连续性专家、项目管理专家和一系列经过验证的分析、设计、实施以及测试服务步骤为您提供全面和详尽的容灾方案部署和应用。

  惠普公司所提供的容灾解决方案是端到端的整体解决方案。它不但是指该容灾解决方案涵盖了从服务器、存储系统、光纤网络互连设备到软件、数据库的全部IT相关范围,还包含了人员组织建设,人员培训和容灾知识普及,灾难恢复流程设计和演练等等内容。同时惠普公司所提供的解决方案还包括实施完成之后的持续支持服务,并可根据用户的实际需要,定期对用户的容灾系统进行灾难演习,防患于未然。

  惠普公司在国内已经实施的容灾解决方案遍布各个行业,采用的技术手段种类众多,距离长短不一,最远达到了2500公里,在国内几乎是唯一的。主要的成功案例包括广东国税、中国移 动清算系统、辽宁联通、长沙电信、上海社保和平安保险等等。

  在今天的科技社会中,IT技术的运用已经渗透到了我们生活和工作的各个层面,为我们带来了以往任何一次技术革命都没有的便利和迅捷,可以说,由于采用了IT技术的新的生产方式已经基本上代替了原来的生产方式,成为现代社会运作和发展的主流,我们对计算机系统的依赖超过了以往任何一种技术。

  然而计算机系统在为业务的迅猛发展提供信息技术基础架构的同时,也带来了以往我们不曾发觉的负面因素。例如由于信息和处理的高度集中使业务运转过度依赖于IT系统,并会因为IT系统的突发问题而受到很大影响,严重的甚至可以导致业务系统无法正常进行。这些问题包括了进行系统检修和升级带来长时间的系统停机,系统自身的或者人为的因素或事故发生连锁性的扩大,以及不可预见的故障和突发性灾难等等。如何避免业务运转受到影响,或者使业务影响尽可能降到最低,这是每一个企业管理者必须考虑和重视的问题。

  本解决方案能提供的对策:

  提高IT系统的高可靠性以及IT系统的容灾建设已不再是新鲜的话题了,随着许多用户实施业务系统大集中,针对IT系统的高可靠性和容灾能力的需求日渐突出。例如,现在很多电信运营商都已经实施了有针对性的容灾系统,并且更多讨论的是如何实现业务数据的有效保护和电信业务的连续性运行。

  然而,目前大多数容灾系统的建设还是存在许多问题的。这些问题中不仅有技术层面的缺陷,还有在流程和人员方面的不足。这些问题可能导致的直接后果就是当发生灾难时,根本无法实现应用系统的快速恢复,甚至可能导致业务运转的长时间灾难性中断。我们可以列举出其中的一些:

  仅从产品功能层面考虑问题,最终建设的容灾环境仅是一个多种产品的堆积。仅实现了数据的远程复制或者离线存放,没有进行灾难的各种场景测试和灾难预演,并缺乏灾难恢复机制和危机应对流程。发生灾难时,不知道到底数据或者系统能否恢复正常。

  进行了一定的测试和预演,但是缺少相应的灾难恢复计划和特殊情况下的行动指南,更没有全面的业务连续性计划。在真正发生灾难时,百废待兴、千头万绪的情况下,没有依据和参考,可能无法顺利进行有关操作。

  有了灾难恢复计划等必要文档,但是没有及时的将IT系统,业务流程和管理人员等不断变化的信息更新,导致容灾手册成为一纸空文。

  具备了以上的要素,但是容灾系统的建设局限在IT部门,缺少业务部门的参与和管理高层的介入和全力支持。发生灾害时,IT系统能够恢复但是业务流程仍无法恢复运转。

  除了以上列出的问题之外,还有许多问题如容灾系统的负载能力估计不足,实施过程中没有严格遵循高可靠标准,实施过程工作界面过多沟通不足,日常运维管理方面存在不足和漏洞,缺少厂商、系统集成商的后续支持服务等等都可能导致业务持续性系统建设的失败。

  除了以上的问题之外,另一类问题是项目小组仅将目光放在了大型灾难等突发事件的应对之上,而忽略了计划性停机对业务运行的影响。根据有关统计,非计划性停机只占13%的停机概率,而在非计划停机中大型自然灾难占的比例就更低了。所以在项目实施时,未能很好的优化现有系统和流程,没有充分发掘现有潜力,未能将日常操作流程和业务持续性目标充分整合,虽然实现了容灾但是仍没有从本质上解决持续性问题。

  惠普公司提供的业务连续性解决方案是基于惠普公司长期的实践经验和业界公认的业务持续方法论(BCP),结合客户的具体实际情况,采用惠普先进成熟的软硬件产品和技术,由资深顾问和技术专家构成的实施小组遵循IT服务管理(ITSM)理念进行实施。充分考虑了以上普遍性问题,保证了项目目标的成功实现,同时惠普公司可以提供整个容灾项目的整体解决方案单点后续支持服务,这一点完全不同于业界其他友商仅能提供单一产品支持的服务模式。

  业务连续/容灾解决方案(Business Continuity / Disaster Recovery Solution)是惠普公司专为希望采用远程灾难恢复的方式实现关键业务数据保护的企业用户提供实施帮助而设计的,它通过惠普公司业务连续专家,项目管理专家和一系列经过验证的分析,设计,实施以及测试服务步骤为您提供全面和详尽的容灾方案部署和应用。

  采用HP的业务连续/容灾解决方案,可以帮助客户从三个方面进行业务连续系统的建设:

  1. 通过多种技术手段实现关键业务远程灾难恢复的目的。包括数据的远程复制,关键业务应用程序的紧急切换,关键业务的连续运性。数据复制可以使用惠普高端智能磁盘阵列XP家族或EVA家族中的 Continuous Access XP或者Continuous Access EVA等硬件级的数据复制功能,也可以利用第三方的数据复制软件(如Vertias VVR, Quest SharePlex, TIBCO , Oracle DataGuard等等)实现数据远程保护。应用切换可以利用惠普集群软件MC/SG,HP Metro-Cluster ,HP continental Cluster或者其它厂商的高可用性软件,如SUN VCS,IBM HACMP,MS MSCS等等,使得地理上分布在城域范围内不同位置的开放业务系统成为一个通过存储服务器硬件或软件方式实现实时远程数据复制,并可对应用进行自动故障切换的单一可管理系统。对客户的网络系统进行冗余设计和冗余路由设计,保证关键业务的使用者可以进行业务操作,从而达到业务连续的目的。

  惠普StorageWorks XP高端磁盘阵列家族目前包括XP12000,XP1024和XP128三款产品,容量可以灵活的从几个TB升级到300TB以上。惠普StorageWorks EVA家族包括EVA5000和EVA3000两个产品,是目前业界最新技术的存储虚拟化产品。XP和EVA家族均提供了基础存储层的远程数据复制技术。

  2. 帮助客户建立一个业务连续团队,包括人员选择,制定相关的角色和职能,相关技术和流程培训等等。使得客户有合格的人员和严格的制度保证业务连续系统作用的有效发挥。

  3. 为客户建立一套行之有效的业务连续计划,包括多个关键流程如:灾难信息通知流程,灾难界定与决策流程,紧急应对和业务切换流程,紧急运行管理流程,系统恢复和业务回切流程等等。使得业务连续成为有章可循,易于操作的系统。

  惠普公司所提供的容灾解决方案是端到端的整体解决方案。它不但是指该容灾解决方案涵盖从服务器,存储系统,光纤网络互连设备到软件,数据库的全部IT相关范围,还包含了人员组织建设,人员培训和容灾知识普及,灾难恢复流程设计和演练等等内容。同时惠普公司所提供的解决方案还包括实施完成之后的持续支持服务,并可根据用户的实际需要,定期对用户的容灾系统进行灾难演习,防患于未然.

  价值主张

  惠普拥有中国最多通过国际容灾协会(DRII)认证的专家,是中国开放系统架构中实施DR系统最多的厂商,在所有行业已成功实施了业务连续/容灾解决方案。这一端到端的整体解决方案,包含了容灾系统所需要的完整的产品线和服务,极大地提高了企业IT系统的可用性和业务连续性。

  规格说明 优势与收益

  硬件 HP ProLiant系列工业标准服务器为 Windows ? 、Linux ? 和 Netware ? 环境优化的工业标准服务器

  HP Integrity动能服务器于 Itanium? 处理器系列,优化用于 HP-UX、Windows?、Linux?、以及 OpenVMS?(即将支持)环境

  HP NonStop服务器

  HP 9000服务器

  HP Alpha服务器

  HP StorageWorks磁盘阵列系统

  HP StorageWorks磁带存储系统

  HP StorageWorks网络连接存储

  HP StorageWorks SAN基础设施

  在IT系统架构层面

  丰富的硬件产品线,从PC机到高端服务器和存储产品。HP均有相关的产品提供。

  在存储硬件层面

  从低端到高端存储,均支持容灾技术。还可以提供全面的磁带库、光盘库备份产品,以及各种规格的SAN光纤网络产品。

  大量成功案例

  软件 HP Continuous Access XP远程数据复制软件

  HP Continuous Access EVA远程数据复制软件

  HP CASA 基于SAN的远程复制软件

  HP MC/SG, Campus/Continental Cluster Software容灾集群软件

  HP SAM SAN管理监控软件

  Continuous Access成熟的同步/异步 复制技术

  OPENVIEW产品的市场占有率

  OPENVIEW产品的技术优势及支持中文环境

  OPENVIEW产品的集成性和开放性

  服务 容灾系统咨询服务

  容灾系统评估/

审计服务

  容灾系统测试/灾难预演服务

  全方位支持服务"Phone-home"远程监控

  SAN环境支持 PSP/PQSP

  24*7容灾支持响应中心

  全天候专人职守

  系统问题单点联系

  4小时到场服务

  大量成功案例

  惠普拥有全线产品和技术人员,涵盖了容灾系统所需要的从服务器,存储,网络,数据库,应用,管理流程等各个方面。而其他厂家往往只能提供其中一部分产品或服务,HP能够提供从容灾IT基础架构,运营管理,灾难恢复计划到业务持续计划的全面解决方案

  此解决方案各阶段的交付

  阶段1:分析阶段

  实施IT系统的灾难风险评估和业务影响分析,帮助客户进行容灾系统的可行性分析,制定RTO和业务连续战略。主要针对核心系统。

  阶段1:成果

  完成风险评估(RA)和业务影响分析(BIA), 制定出可行的恢复时间目标(RTO)和恢复点目标(RPO)

  阶段2:开发和设计阶段

  分析客户计算机系统硬件和软件环境,数据复制链路情况,分析应用软件环境并提出满足用户高可用需求,切合实际的远程数据复制方法。提交容灾系统架构设计的方案。进行客户访谈,了解客户IT管理组织架构,进行容灾团队的设计。根据设计采用的IT技术和客户关键业务的特点,进行相关恢复流程的设计。

  阶段2:成果

  容灾系统建设草案,组织团队建设草案,流程设计草案等。

  阶段3:安装、配置及系统集成

  客户化配置逻辑卷存储资源,安装并配置Business Copy及Continuous Access,或其他数据复制工具,实现本地及异地数据复制,安装并配置MC/SG或其它集群软件及灾难恢复环境;将灾难备份与恢复功能集成到系统或数据库启动与关机脚本文件;集成并测试远程数据复制脚本;系统验证。组织团队的建设和相关人员的培训,提高企业人员的访灾抗灾意识。编写灾难恢复计划,将恢复流程具体化成可以照章办事的手册和指南。

  阶段3:成果

  按预定计划配置好的远程灾难备份/恢复环境

  容灾团队的建立,相关的角色职能的制定,相关人员经过培训,合格上岗

  灾难恢复计划(DRP)的制定和分发,校订等管理机制

  阶段4:测试,演练,文档及知识的移交,后期的系统评估和演习服务

  测试并演示高可用性远程灾难恢复功能; 灾难场景的演习; 准备用户文档并进行系统配置及维护移交指导; 帮助客户进行定期的系统评估和演习服务,进行恢复流程的修订

  阶段4:成果

  远程容灾高可用性环境测试验收报告;基于远程容灾的高可用性系统环境的运行维护文档及灾难恢复系统配置文档;针对客户提供为期一天时间的现场知识移交指导;系统评估报告,演习项目管理和演习恢复报告等等

  惠普公司在国内实施的容灾解决方案的客户遍布各个行业,采用的技术手段种类众多,距离长短不一,最远达到了2500公里,在国内几乎是唯一的。

  惠普公司的容灾系统也是经过了实践考验的。在2003年初,上海发生了由于地铁隧道施工造成的地面沉降,由于地面沉降引发了大面积的楼宇倒塌和市政管网系统的损毁,在这场突如其来的灾难面前,上海社保的容灾系统发挥了应用的作用,同时在惠普公司和上海社保IT部门的共同努力下,实现了业务的成功切换,在很短的时间内就恢复了业务的正常运行。

  惠普公司的业务连续方案不仅为客户建立了容灾系统的IT架构,在人员和流程方面也具备独到的优势。惠普公司曾为上海大众实施了容灾系统的流程建设和人员组织建设,为客户的原有容灾系统制定了完善的灾难恢复计划,帮助客户达到了大众总部的IT审计要求。

  惠普公司也为中国平安制定灾难恢复计划。平安保险在2003年基本完成了容灾系统的IT基础架构建设,但没有相应的灾难恢复计划。没有针对灾难发生后的应对、决策、详细的灾难恢复步骤。平安保险拥有众多应用系统,总数超过100多个,其中关键业务系统也超过50个。业务影响分析和灾难恢复计划设计复杂。惠普协助平安保险开发灾难恢复计划。在发生灾难时可以有准备的恢复IT系统。

  广州国税容灾系统基本情况介绍:

  主中心: 广州市

  容灾中心: 从化

  容灾系统:征管系统、金税工程、发票信息库、决策支持系统(部分)

  容灾距离: 104公里

  容灾链路: 155Mb/s SDH链路

  服务器:3台HP SUPERDOME,2台HP RP8400

  存储服务器: HP XP1024 ,HP XP 512

  存储网络设备:CNT EDGE

  数据复制方式:采用惠普XP存储服务器远程数据复制功能实现

  由于生产中心的业务系统相对集中,因此在生产中心实现业务数据的本地规范化数据备份是灾备建设的前提;同时通过进行重要业务数据的远程同步实现用户重要业务数据的异地存储,为实现业务系统远程运作奠定坚实基础;针对广州国税的业务情况,惠普公司推荐采用三级保护体系架构。

  第一级保护:

  针对本地软硬件故障,采用惠普的集群技术MC/Service Guard,实现本地集群。软件或硬件故障时,可以通过本地集群切换,实现业务持续运行。

  第二级保护:

  采用惠普的备份解决方案HP Data Protector和磁带库HP 4/40,实现数据的自动备份。发生数据物理错误或逻辑错误时,可以从磁带库中恢复数据。

  第三级保护:

  采用惠普XP 磁盘阵列的Continuous Access XP,实现数据实时远程复制。在主中心发生灾难时,容灾中心还保存一份数据。确保数据不丢失。同时还可以将应用系统切换到容灾中心,实现业务持续运行。

  容灾系统的关键就是远程生产数据的复制,广州市国税局主要生产系统均为基于数据库的业务系统,所以数据远程复制的关键就是确保数据库数据的连续性,实时性和可恢复性。

  通过惠普最新存储产品XP系列磁盘阵列(磁盘阵列层次),可以实现主数据中心和备份中心的操作系统、文件系统、数据库、的实时拷贝维护。主、备中心磁盘阵列本身就可以通过阵列上的微处理器完成数据实时同步功能,将数据的损失降至最低,而且不需要主机干涉,可以做到灾难发生的同时实现应用处理过程的恢复。

  由于容灾距离超过100公里,主中心和容灾中心的存储局域网的互连采用IP链路,通过CNT EDGE实现SAN到IP的转换。

  实现功能和意义:

  税务部门第一个应用级容灾系统,和远程容灾系统(超过100公里)

  中国第一个采用SAN转IP技术,实现主中心和容灾中心存储网络互连的

  重要业务数据保护

  重要业务在灾难发生后可以在短时间内恢复,持续运行

  可以抵御的灾难

  - 自然灾难:

地震,火灾,水灾,台风,电力故障等

  - 人为灾难:恐怖袭击,人为破坏等

  - 软件硬件故障

  提高了系统的可用性,减少计划性停机和因为系统故障导致的非计划性停机

  进一步提高国家税收的声誉,增强广大纳税户以及市民对政府的信心

  长沙电信容灾系统基本情况介绍:

  业务发展:湖南电信长沙分公司(以下简称长沙电信)隶属湖南电信公司,是湖南电信下辖的14个市州分公司之一。

  电信IT系统的应用直接关乎管理、服务、成本、效率等各个重要环节,并最终全面影响电信运营商的竞争力。目前,电信行业的"大集中"建设已进入省级大集中阶段,任何单点故障都有可能导致整个系统的停顿与瘫痪。同时电信行业也是一个讲究系统高可用性的行业,它要求所有关键IT设备必须24*7的不间断运行,以满足超大量用户的实时访问,一旦宕机或者系统发生故障,不仅严重影响电信运营商的业务运营,更将严重影响客户满意度,削弱竞争力。为了保证系统的全面、安全运行,长沙电信容灾系统的建设,是保证整个业务信息系统稳定和数据安全的关键所在。为了有效降低关键业务的运行风险,最大限度地保护所有核心业务数据,增强数据中心的可用性和业务规划的灵活性,从而提高整个企业的核心竞争力,长沙电信决定在建立计费营业系统的同时,建立同一机房内的容灾系统,降低关键业务运行风险,最大限度地保护业务数据的实时性、完整性和一致性。

  应用需求:对长沙电信而言,本地网计费和关口结算系统是非常重要的核心系统,这两个系统一旦宕机,则将造成无法挽回的损失。如何保证这两个系统在任何情况下,包括发生灾难时,安全可靠与万无一失,是长沙电信面临的重要问题。在这里,灾难的定义主要是指自然的和人为的灾难,包括系统硬件,网络故障,机房断电甚至火灾地震等。因此,HP需要建立核心系统的容灾备份,在同一机房内建立生产系统以及容灾系统,在生产系统发生故障时迅速切换到容灾系统,使业务实现不中断。

  其中,作为长沙电信整个计费营业系统与关口结算系统的核心部件,存储平台一方面要成功处理各种计费业务和结算活动,提高自动化水平和系统维护管理水平;同时还要在灾难发生时,快速、准确在恢复所有应用,有效保证业务的连续性。基于自身的使用需求与系统特点,长沙电信特别要求存储系统要建立在开放系统之上,并在一定规模上可以实现数据的复制能力。

  解决方案:长沙电信以HP 9000与HP Integrity动能系列服务器作为计费服务器,整个系统运行计费营业经营分析软件,并采用HP UNIX作为操作系统,同时建立相应的单个集群容灾系统。其中,长沙电信特别选择了HP StorageWorks企业虚拟阵列EVA5000与EVA3000 与HP远程数据复制软件Continuous Access EVA(EVA CA),来存储整个系统的网络资源和数据。

  HP产品和服务:HP StorageWorks企业虚拟阵列EVA5000与EVA3000各1台

  为什么选择HP: HP StorageWorks EVA5000与EVA300业界领先的虚拟化存储技术与超过其他竞争厂商的高性能,是长沙电信选择它们的首要原因。EVA5000与EVA300在高性能、高稳定性、易管理性等方面不仅能够确长沙电信目前的存储需求,同时管理更加方便,能够动态扩容,灵活适应未来的发展要求。借助HP远程数据复制软件Continuous Access EVA(EVA CA),HP StorageWorks EVA5000虚拟存储阵列,轻松实现了数据容灾。EVA CA容灾可以实现生产站点与备份站点之间的数据复制,轻松切换。EVA CA还能够实现阵列之间的单向、双向支持,以及数据容灾的可管理服务和数据容灾的自定义系统,帮助用户轻松制定用于业务持续性规划的数据容灾解决方案,实现同步、异步,多重关系,全面实现生产站点与备份站点之间的数据复制,轻松切换。

  应用效果:HP StorageWorks企业虚拟阵列EVA5000与EVA3000在高性能、高可用性与可扩展性方面的优异表现,全面满足了长沙电信计费营业与容灾系统的性能和功能要求。目前,除正常的计划性停机外,该系统可以做到365*24的可用性,全面保证了长沙电信业务的连续性。

  客户评价

  HP不只是为我们建立了一套容灾系统,而是构建了一个保障业务永续运行的平台.―― 中国建行湖南省分行信息处处长 梁放

  市场评价

  2004年12月,中国计算机报(ChinaInfo World)评选惠普高端存储阵列XP12000为“2004年最佳编辑选择存储产品大奖”

  2004年8月,由

中国电子信息产业发展研究院(CCID)和中国信息化推进联盟(CFIP)主办的"CCID中国IT服务市场及用户满意度调查",中国惠普荣获

  2004年中国最具价值的IT服务品牌大奖

  中国IT运维与外包服务用户满意品牌大奖

  2004年8月,中国惠普有限公司在中国质量协会用户委员会与计算机世界传媒集团共同举办的2004中国IT用户满意度调查中,HP服务荣获“IT运维服务用户满意度综合第一大奖”

  2004年6月,HP存储设备荣获CWEEK 2004年中国IT产品行业竞争力电信行业服务满意奖

  2004年6月,中国惠普有限公司获得《电脑商报》2004中国电脑商500强之供应商100强"最佳存储产品供应商"大奖

发表评论

爱问(iAsk.com)



评论】【论坛】【收藏此页】【 】【多种方式看新闻】【下载点点通】【打印】【关闭




科技时代意见反馈留言板 电话:010-82628888-5595   欢迎批评指正

新浪简介 | About Sina | 广告服务 | 联系我们 | 招聘信息 | 网站律师 | SINA English | 会员注册 | 产品答疑

Copyright © 1996 - 2005 SINA Inc. All Rights Reserved

版权所有 新浪网