摘要:电力企业的信息网络承载着日常生产办公的重要业务,县级公司至地市公司的信息主干网络一般采用一主一备的双通道模式,遇故障时通道自动倒换成为提高网络可靠性的重要因素。为了解决公司信息网络出现的故障发生时无法识别、倒换的问题,文章通过探寻原因,提出采用网络质量分析(NetworkQualityAnalyzer,NQA)、双向转发检测(BidirectionalForwardingDetection,BFD)、Track等故障探测策略来解决路由黑洞问题,实现了故障时的自动检测,能够预防由于单点故障造成的网络中断事件。
关键词:电力信息网络;双通道;自动倒换;故障探测
引言
随着电力行业由“企业信息化”向“信息化企业”的转变,信息系统与企业的生产经营联系更加紧密[1]。企业信息网络作为生产办公的重要网络,庞大的用户群体、广泛的业务应用对其安全性、可靠性提出了严峻的考验[2]。县级供电公司至地市公司信息主干网络是与上级单位进行信息交互的唯一通道,是公司信息网络的最核心部分。为提高网络可靠性,一般采用双通道冗余配置,链路状态的探测和链路状态的快速自动倒换成为亟需解决的问题[3]。当主用链路突然出现各种类型的故障时,网络能够识别并自动切换至备用链路,保证在运业务不发生中断,以上这些是实现网络结构健壮性的重要挑战[4-6]。基于日常运维经验及从对运营商、各企业网的调研中发现,网络链路故障时经常发生无法自动倒换这一缺陷,且容易被忽视,对在运业务造成了严重影响。为了解决这一问题,文中对故障探测策略的分析和应用进行了探讨。
1信息网络概况及面临的问题
该信息网络为“口”字形双链路组网(见图1)。因电力企业丰富的光传输链路资源,光传输以太链路的应用相当广泛[7],光传输以太链路结构如图2所示。信息网络主通道承载在光传输以太链路上,上联至ATM广域网;备通道为光纤直连通道,上联至数据通信网。信息网络与广域网之间的2台边界路由器H3CSR1、H3CSR2通过开放式最短路径优先(OpenShortestPathFirst,OSPF)协议设置cost值来控制主备优先级;均写入缺省路由指向上一级广域网,其通过采用下发缺省路由的方式,将缺省路由通告到整个OSPF域中。对于IP网络来说,Ethernet接口的故障检测时延没有保证,尤其是当网络设备间以太链路经过一些传送设备时,链路的状态有时无法反映网络设备的状态。静态路由具有可靠、安全、稳定、高效等特性,比较适用于接入路由至核心路由的级联,但其缺少网络动态变化的反应能力[8]。因为SR1上存在缺省路由,当至上级的远端链路中断时,由于中间的光传输设备的原因,SR1的G1/0/0端口一直up,造成SR1上这条缺省路由一直生效,因此无法倒换到备用通道。即导致所谓的“路由黑洞”问题[9]。根据信息网络双出口设计的不同,出现的问题也多种多样,所需采用的探测策略也不同。下面针对双通道自动倒换的需求,对几种典型探测方法进行讨论。
2几种故障自动探测策略的技术特征
随着IP网络多业务的应用和高实时性需求,网络对故障的反应速度成为衡量网络可靠性的重要参数。传统的慢hello机制的方法已暴露出明显的缺陷,无法满足当前IP业务应用的飞速发展。各种IP协议,如OSPF、中间系统到中间系统(IntermediateSystemtoIntermediateSystem,ISIS)对于故障的反应速度一般需要1s以上。网络接入侧所使用的虚拟路由冗余协议(VirtualRouterRedundancyProtocol,VRRP)等冗余热备方法,故障切换时间也需1s以上,对于电信级的网络而言,难以达到50ms内切换的标准。接入网络与核心网络级联通常采用的静态路由协议,更是不具备链路状态反应能力,只要端口状态正常,则路由条目一直生效,故障发生时无法切换。在这种情况下,一些故障探测策略应运而生,可以有效弥补现实网络中存在的不足。2.1BFD技术双向转发检测(BidirectionalForwardingDetection,BFD)是一种通用的协议,独立于上层应用程序,无关通道类型,采用了一种简单的hello机制,可以达到毫秒级的故障检测速度。BFD是在上层协议的基础上建立BFD会话,不具备自己的发现机制[10]。通过发送、接收BFD会话的过程,判断双方之间的状态并确定故障的发生,与光传输中的“LOS”信号具有相似的机理。BFD具有灵活的特点:BFD可以实现单跳检测,也可以实现多跳检测;BFD的检测周期可以根据实际需要进行设置;BFD可以实现与多种上层协议的联合使用。1)BFD与快速重路由(FastReroute,FRR)的联合使用。在网络规模较大或结构较为复杂的网络,当发生故障时,路由的计算、收敛耗时较长。FRR是网络中指定的备份路由,当故障发生时可以实现快速切换。BFD与FRR的联合使用,更加进一步加快网络的故障响应速度,大大缩短故障时间。2)BFD与内部网关协议(InteriorGatewayProtocol,IGP)联合使用。ISIS的故障检测时间大约为1s,OSPF的故障检测时间大约为2s。而BFD的快速故障检测速度与ISIS、OSPF的联动,可以将故障检测时间降至毫秒级。3)在网络边缘部署BFD。接入网络与主干网络的互联一般通过2台出口交换机或路由器设备,利用VRRP提高双出口网络的可靠性。而通过BFD探测双出口链路状态,可以不必等到VRRP自身感知到链路故障这段耗时,提前通过BFD联动VRRP实现故障倒换[11-12]。当网络出现故障时,BFD的检测原理如图3所示。1)BFD在会话中监测到设备或链路故障;2)BFD邻居会话被拆除;3)BFD将邻居不可达信息通知给本地上层协议;4)上层协议邻居关系被中止,具备条件时启用备用路径。2.2NQA技术网络质量分析(NetworkQualityAnalyzer,NQA)适用于H3C等系列设备,可以实现对网络丢包率、网络时延、网络抖动等性能的监测。通过测试报文的周期发送,实现对网络状态和服务质量的精确测量,为用户提供了反映网络质量的系列参数。NQA可以实现与Track的联动。NQA将自身监测到的结果反馈给Track,触发Track与应用程序的联动,实现对网络状态变化的快速反应。NQA可以支持多种网络测试类型,并支持多测试组的并发,如:可支持ICMP-echo、FTP、TCP、UDP-echo等多达11种测试类型。以ICMP-echo的应用举例:NQA根据设定的探测周期定期向目的地址发送ICMP-echorequest报文,通过对端回复的ICMP-echoreply报文的情况,计算得出响应时间、丢包率等关键参数,为用户提供该网络的服务质量情况,从而快速切换网络。NQA目前实现了与多种应用程序的联动,如VRRP、策略路由(PolicyBasedRouting,PBR)、静态路由等。2.3IPSLA技术互联网服务等级协议(InternetProtocolService-LevelAgreement,IPSLA)适用于Cisco设备,一般适用于Cisco企业版IOS等。用法与NQA有极大相似性。IPSLA是主动网络测量手段,采用了一种动态流量监测方法;可用的测量类型和测量次数非常丰富;也是采用定期测试的方法。其测试原理可比喻成一个实际的人,通过ping、www、telnet等访问某目的地址,并以此判断网络的运行状况。可实现与CiscoTrack的联动。通过Track,将IPSLA的探测结果影响到热备份路由协议(HotStandbyRouterProtocol,HSRP)、PBR、浮动静态路由等协议,实现故障的快速切换。2.4Track技术Track的用途是实现联动功能(见图4)。Track联动功能是联系起应用模块和监测模块的桥梁。利用上文介绍的BFD、NQA、IPSLA等监测模块进行检测,通过Track的桥梁作用,将检测结果反馈给应用模块,促使应用程序的进一步执行。例如:在静态路由、Track、NQA间建立联动。当NQA监测到静态路由下一跳地址不可达时,立即触发Track,将静态路由条目置为无效。通过这样的联动,实现了静态路由有效性的实时判断,克服了静态路由无动态反应能力的不足。
3故障检测与保护的解决方案
3.1应用场景A针对上文所述的该公司信息网络存在的问题,在SR1上采用Track+NQA+静态路由的方式,当主通道侧光传输以太链路中断时,虽然G1/0/0端口up,但经测试IP:10.b.b.b不可达,这时,SR1的缺省路由失效,实现倒换至备通道。虽然主通道故障时,数据的发送倒换至备用通道,但采用下发缺省路由的方式,已将缺省路由通告到整个OSPF域中。ATM广域网Iproute-static0.0.0.00.0.0.010.b.b.b(cost20)的缺省路由条目,在其老化时间内,仍旧向主通道返回数据,收发路径不一致,网络仍旧中断。因此在网络设计之初,应全面考察链路条件,当网络链路存在大量光传输设备时,也要尽量避免完全依赖探测的辅助手段,应优先考虑采用动态路由协议组网。以上问题通过改为OSPF协议并联动BFD,得到了更合理的解决。3.2应用场景B某县信息主干网络如图5所示。图5中横线上端为全省数据通信网广域网,信息网络为其中一个OAMIS的VPN业务;横线下端为某县级供电公司信息网络。信息网络与广域网之间的2台边界路由器H3CSR1、H3CSR2,仍通过OSPF设置cost值来控制主备优先级;均写入缺省路由指向上一级广域网,其通过采用下发缺省路由的方式,将缺省路由通告到OSPF域。数据通信网CiscoR1、CiscoR2分别配置静态路由指向下方2台边界H3CSR1、H3CSR2路由器。
4结语
信息网络双出口故障自动倒换是保证信息网络安全可靠运行的重要因素。而在进行网络的组网设计时,网络工程师往往采用经验方法,忽视做全面的故障倒换测试。因此在网络设计之初,应全面考察链路及设备条件,因地制宜。本文就企业信息网络双出口自动倒换遇到的实际问题,引出了故障自动探测的几种策略并进行了技术原理介绍。通过2个实际场景,举例介绍了Track+NQA(IPSLA)+静态路由在县级信息网络双出口中的应用及如何巧妙地解决自动倒换问题。
作者:何天玲 单位:国网福建石狮市供电有限公司