云计算平台网络
对云计算平台的物理网络而言,其可靠性可以分为以下的几类:
多线路,常见二层的LACP,也就是链路聚合,对三层则使用等价路由。装备HA,从体系结构来说,散布式的多框、多插槽的装备能够提供多主控、多接口板这样的方式,还可以提供类似于堆叠技术和多机之间的双机热备和多机的备份还是多机堆叠的方式,还可以提供VRRP的链路切换。探测和切换机制,实际上在网络配置交付以后,如果远端出现了问题,为了解决链路上的负载均衡和主备切换的问题,可以引入比如NQA+Track这样的探测技术,这样可以针对静态路由的配置通过不同的优先级和NQA探测方式发现远端节点不可达的时候进行路由切换。
除此以外,在探索到某台装备出现故障的时候就能够进行故障隔离,可以实现端口级还是装备级的故障隔离,保证流量可以走备份还是冗余链路进而避免流量中断,固然,这类情况下可能对流量带宽造成一定的损失。巡检和监测,针对Overlay和Underlay的网络会提供主动探测的机制,还有对装备的平常日志告警的分析。
装备在运行中常常会报很多的日志和告警,将这些信息搜集起来以后结合云平台的业务流量可以发掘出很多故障的可能性、已出现的故障还有对未来可能出现故障的预判。还可以进行流量分析,并且基于此判断云平台的网络是否是出现了一些问题。