作为存储业界的技术和服务开发领导者,EMC公司全面协助各公司在极端灾害情况下保护其信息和IT能力。
Barron杂志赋予EMC公司SRDF复制软件以纽约9.11大灾难中的“技术英雄”的美誉,称赞其在协助各企业迅速的、预见性的恢复运营方面发挥了关键而重要的作用。9.11世贸中心大灾难的规模和烈度充分说明,技术对全球所有企业和IT领导人的意义已经到了非常关键和 重要的程度。
我们在此浅谈一些企业界需重视的教训和启示,罗列了一些关键问题协助您针对贵公司可能面临的最极端威胁做好充分准备。
教训一:距离是关键
有谁会料到,那些桥梁和隧道竟然也会成为IT基础架构的单故障点?“911事件”改变了所有这一切,它向我们提出访问第二备用站点的能力也可能受到具体情况的限制。灾难的实际波及面可能远远超出您本地设施的范围,支持人员往往无法及时到达站点所在地,站点与站点之间的通信也可能遭到破坏而中断。许多人可能无法从待恢复受灾处前往备用恢复站点,因为他们可能会遇到许多无法预知的情况,因为街道、桥梁、隧道和所有机场都会关闭。
问题:
到达备用站点的能力是否取决于相同的物理基础设施,比如高速公路、机场、桥梁和通信网络?
站点之间的地理接近是否意味着您会依靠主站点人员参与恢复进程?
教训二:磁带并非有效的恢复介质
事实已经充分证明,将磁带作为备份和恢复途径将把您置于脆弱的境地。IT人员面对911事件终于醒悟,尽管他们过去相信磁带已经“够好”,但现在却发现存取磁带信息的能力可能会受到限制甚至完全丧失。就有效恢复业务流程而言,恢复事件可能过于漫长。即使能够通过磁带访问并恢复那些文件,其中许多文件的质量和可靠性也已降低(这是磁带介质自身的局限所致)。恢复事件通常需要漫长的5天时间,这远远超出了人们希望的时间范围。而且,由于磁带极易因为人为错误而受损,在许多情况下信息可能并未实现备份或一致备份。
问题:
您是否已经针对贵公司的完整IT环境成功完成全面恢复测试?上次恢复测试之后,您的数据增长量是多少?(被保存信息量的翻倍往往意味着恢复时间延长一倍。)您的测试是否曾经因为磁带出错而发生故障?您是否在一个24x7环境中参与竞争,恢复周期的延长是否将令您付出丧失竞争优势或承受财务损失的代价?
教训三:所有应用都是关键的
电子邮件已经成为传递企业信息和知识的最关键通信手段之一。如果通信线路严重紧张,那企业业务流也可能陷于同样境地。911事件发生之后,许多企业发现大量进行中的计划书、贸易协议以及交易和协议的归档都包含在其电子邮件系统中。但面临危境的绝不仅仅是电子邮件:今天,绝大多数业务经营活动和应用都是相互关联、相互依靠的。如果基础应用或第三方应用的内容或其它信息资产丢失了,那么这种丢失的影响面通常会波及更高级应用,比如CRM或ERP应用等。
问题:在贵公司中,您是否给予电子系统和计费系统同样强烈的紧急备份要求?在贵公司中,究竟有多少企业信息和知识依赖贵公司记录系统以外的信息?您的信用责任是否仍然依赖于未受保护的信息或系统?
教训四:非一致性备份称不上是真正的备份
在911事件发生之前,尽管备份数据也是一项必要任务,但其执行过程并不那么精确或规律。但是,它现在已经成为一项必须实现的要求。针对不同应用制定不同的备份日程和战略意味着,基础广泛的业务流程所必需的信息可能无法实现匹配或重新组合。而各应用的不一致备份显然也会大大延长恢复时间。
问题:您如何才能确认各应用备份已经实现同步化?当每项新应用投入在线运营后,您是否对备份计划和IT开发规划进行再同步?您的IT基础架构是否难以或不可能管理跨越多种环境的信息?
教训五:依赖人员操作的流程已无法完全满足需要
当911恐怖事件猝然发生时,您的第一个念头是什么?也许您根本就不会去考虑保护公司信息的问题。在类似911事件规模和烈度的危机事件中,人们首先会想到他们的家人以及其它个人责任,这也是完全正当的。即使当人们着手开展工作时,许多人也不太可能前往备用站点履行其职责,因为道路可能已经被封闭,因为安全考虑可能不允许这么做。表现最好的IT系统则是那些能够自动执行恢复任务,减少人为干预和磁带运送和上载等人工活动的IT系统。另外,脆弱惊恐的员工也极易发生错误,最终导致犯错,并延长恢复流程的实际需要时间。
问题:如果没有主站点人员的参与,您的恢复战略是否变得不堪一击?贵公司恢复工作团队的工作能力和熟练程度是否与主站点运营团队相同?贵公司是否已经实现日常任务和恢复战略执行的自动化,是否已经尽可能减少人工干预需求?
教训六:两个站点已不足以满足需求
许多公司都吸取了一个尖锐的教训:即使配备了备用站点,它们也可能在灾害发生后遭到完全破坏,因为各种业务流程现在往往依赖单个共用设施。在业务提供商受到打击的情况下,这些公司往往会面临困境,因为其工作状况可能在相当长一段时间内远远低于其既定的信息保护和业务连续策略水平。显然,信息和人员都需要通过新的渠道加以分散配置。问题:如果您已经签订了业务水平协议,那么协议合同是否限制了您使用公用设施的时间期限?根据您的竞争和信用要求,贵公司是否能够认可并接受单个在用站点作为充分保护手段?
教训七:服务提供商无力承担突发的海量要求
依赖磁带或第三方提供商的许多公司发现,它们往往会在实现其恢复时间目标方面遇到困难。原因何在?灾害恢复提供商在制定计划时往往认为只有很少比例的客户需要同时提供服务。因此,这次大规模、受到全球普遍关注的事件就可能对其业务提供能力提出突发的、无法预计的海量要求,因为客户试图在同一时间段内访问优先的资源。
问题:您的服务提供商是否在先进入/先获得服务的基础上运作?您是否了解服务提供商及时扩展满足突发要求的能力?您是否在信息和业务流程的恢复能力方面完全依赖服务提供商?
教训八:信息和人员都是无法替代的财富
公用设施可以租用,蜂窝电话可以短暂切入陆基线路。但就各企业而言,其开展业务的能力取决于关键人员及其履行职责所需关键信息和系统的可用性。各企业发现,一旦人员受到保护,那么信息就成为了无法快速替换的资产之一,没有信息作保证,即使员工再勤奋,他们重新恢复业务运营的能力也会大打折扣。
问题:您是否自信地认为企业依赖的所有长期和短期信息都已经受到保护,在发生灾害时也能确保可用?贵公司从产品开发活动直至客户情报的所有知识资本是否都与交易应用一样受到了保护?
教训九:不可忽视灾难发生的可能性
911事件的现实及其后续事件高度表明,我们亟须制定并实施灾害恢复计划,因为只有这样才能确保业务连续性。现在,在平衡强烈的保护需求和公司财务和资源现实之间的关系方面,IT管理人员正在承担愈来愈多的责任和负担。
问题:贵公司是否曾经针对行业、地理位置和周围基础设施,集思广益开会讨论所有相关灾害和意外事件?您是否根据上一次灾害而非可能发生的下一次灾害设计并编制当前灾害恢复计。
点一支歌送朋友,带给他(她)春天的信息和你的心意!
15秒快速订短信 精彩资讯尽在“掌”握
|