随着新冠的爆发,IDC面临更多变数,因为发生疫情可能意味着员工数量减少,运维服务和供应链可能中断。远程监控和预防性维护将有助于降低故障的可能性,但机器经常会出现故障。通过增加系统冗余来降低故障的影响是有意义的。
然而,即使在疫情之前,IDC行业也有提高冗余度的趋势。
云计算平台能否解决停机问题?
对一些人来说,这种趋势似乎并不奇怪,但也不是完全可以预测的。随着多站点灵活性和可用区域的增加,云计算得到了广泛的应用。至少在理论上,这可以显著降低单个IDC设施服务中断的影响,因为流量和工作负载可以转移到其他IDC。在这种能力的支持下,一些IDC运营商(如Facebook)采用了比过去更低的冗余级别,从而节省了成本和能源。
然而,可用性区域的使用也会面临一些问题,网络和软件问题通常会导致服务中断。服务中断后,一个IDC立即将容量和流量需求转移到另一个IDC,增加了风险。因此,即使是大型云计算提供商和全球网络运营商,也大多同时管理可维护的IDC设施,通常要求托管合作伙伴拥有或运营“N+2”冗余级别的IDC设施。
在各种选择下,向增强冗余的整体过渡仍然缓慢而微妙。IDC设计师根据业务需求,大多采用“N+1”或“N+2”冗余配置,这通常取决于IDC设计师的创意。总的来说,2NIDC的数量实际上略有下降,但三年间从“N+1”稳步变为“N+2”——不仅在功率上,在散热上也是如此。
渐进的关键性
需求模式和不断增长的IT依赖性在某种程度上解释了这些更高水平的冗余。每个服务或客户所需的冗余级别由业务需求决定,但不是固定的。许多IT服务越来越重要,这突出了通过增强冗余来降低风险的重要性。“渐进关键性”(IDC基础架构和流程尚未升级或更新以反映其支持的应用程序或业务流程日益增长的关键性)可能需要升级冗余性。
IDC运营商未来将更多地使用分布式服务,尤其是在使用云计算或微服务架构设计更多工作负载时(工作负载更便携,其实例更容易复制)。但没有迹象表明对IDC冗余的需求正在减少。运行这些分布式服务的软件通常是不透明和复杂的,并且可能容易出现编程或配置错误。根据年度调查数据,此类问题正在激增。此外,任何大型组件故障都可能级联,这使得IDC恢复困难且成本高昂,并且其数据和应用程序可以在多个IDC之间同步。
目前的趋势是显而易见的:加强各级冗余是风险最小的方法,即使这意味着一些额外的费用和重复的工作。