前不久韩国数据中心火灾可谓是韩国互联网的大灾难,很多数据中心宕机事本不该发生,这是一些组织糟糕的计划和维护不当造成的。韩国两大互联网巨头Naver和Kakao成为了此次停机中断事件的受害者,并且也深刻感受到这些可以预防的数据中心中断事件的影响。然而不幸的是,这种情况并不少见。
如何避免数据中心宕机造成损失?
1、事先规划防止电力供应中断
正如关键业务流程依赖IT服务一样,数据中心本身也一定要提供弹性以保持业务运行。它是任何企业风险管理战略中的核心资产。
工作人员的失误,备用发电机没有启动,惊慌失措的决定等这些错误都可以通过正确的流程和完善的电力系统设计来防止。然而,组织往往并没有遵循数据中心电力管理的黄金法则:行动获得结果和产生后果需要采取行动。
组织需要灾难恢复流程,并明确规定在重新启动数据中心时应采取哪些步骤。在数据中心停机中断的情况下,工作人员可能处于忙碌紧张状态,并面临恢复正常服务的压力。毕竟,工作人员的主要目标是尽可能快地恢复正常运营。因此,灾难恢复流程有助于避免延长停电时间。
2、提高工作人员的技能
实际上,数据中心缺乏电源管理意识和理解是一个常见的问题。参与调查的数据中心专业人员中有三分之二的人表明对电力保障没有充分的信心。而在组织在能够掌握电源管理(从UPS维护到电池检查)之前,可能会有更多的与电源相关的停电事件发生。
但是,工作人员的技能对于提高电源可用性有着至关重要的作用。许多组织发现,无论是在能源效率设计、持续管理消费,或快速有效地处理与电力有关的故障,以避免和减轻停电方面,都很难招募和保留相关的专业人员或人才。
3、更新升级基础设施
除了提高技能和保障电力之外,数据中心基础设施本身经常需要更新升级,以满足企业对其效率,可靠性和灵活性的期望。在这个调查中,大约一半受访者表示,他们的核心IT基础架构需要加强,而近三分之二的受访者表示需要加强电力和冷却等方面的设施。
电源管理越来越成为一种软件定义的活动。鉴于工作人员的技能方面的差距,软件可以通过IT人员熟悉的仪表板来提供电源管理选项,以弥合IT部门和电源之间的鸿沟,从而更轻松地进行管理,并实现电力基础设施管理的自动化。采用这种技术可以减少或消除数据中心的停机时间。
行业厂商已经向数据中心的虚拟化环境方向发展。IT和数据中心的专业人员如今已经非常熟悉使用虚拟化技术来维护硬件。那么为啥不使用同样的原则呢?所有的配电设计和相关的弹性软件工具一定要与主要虚拟化提供商的产品相兼容,促进基础设施的未来发展。这种方法将使数据中心专业人员可以持续地维护系统,从而减少基础设施陈旧过时的风险。
更好的准备和灾难恢复过程可能会阻止许多中断事件的发生。数据中心行业用户一定要从这些事件中吸取教训,并采取必要的措施。因此,为了减少数据中心的中断事件,有效实施电源管理是一个必备措施。
以上就是如何避免数据中心宕机造成损失?的介绍,桂哥网络提供企业用户机房到IDC数据中心、企业私有云和公有云,以及企业多云直连的云专线业务,可以快速、有效的为客户提供高速、稳定的专有通道。如果您有相关的业务场景,欢迎咨询,我们有专业的技术团队可以为您提供更好的建议和方案。