服务质量(QoS)技术是IP网络技术能否成为未来统一承载网络技术的关键。从业务的角度看,网络的服务质量包括业务质量和接通率两部分指标。业务质量指已经接通业务的服务质量,可以客观或主观地评价,如IP语音(VoIP)业务的知觉通话质量测量(PSQM)值和平均主观值(MOS),并映射到传统的丢包、时延、抖动等IP网络QoS参数。接通率则是衡量系统工作情况的综合指标,反映业务接续的实现和丢失情况,其对应的指标是呼损。目前IP网络技术在QoS上有了很大进步,衍生出了多种QoS技术[1-2],但是对网络QoS解决方案还有相当大的争议。
每一种QoS技术都有其合理的应用场景,能且只能最佳解决一类特定的QoS问题,研讨QoS整体解决方案必须首先对IP网络中的QoS风险进行分类,进而确定每一类QoS问题各自的对策。
1 QoS风险分类
IP网络是基于分组的统计复用网络,因此高带宽、轻载的网络中也有突发拥塞的可能,进而引起IP网络QoS问题。正因为QoS问题是由拥塞引起的,所以网络QoS风险可以按照网络中拥塞的时间长度分类进行定量分析。如果网络中绝大多数对业务产生关键影响的QoS问题是持续时间在微秒级别的拥塞,则将这类网络问题称为微秒级QoS风险。因此,根据拥塞时间长度对业务的影响程度,以及解决拥塞问题所需要的技术措施不同,网络QoS风险可以分为微秒级、毫秒级、秒级、分钟级,和更长时间级别5个等级。
微秒级的QoS风险可以采用简单的调度机制避免丢包,例如从两个接口上同时到达的分组从同一个端口上输出造成的拥塞,由路由器/交换机的网络接口卡(NIC)成帧缓存,再由转发进程调度,就可以解决这两个包的顺序输出的问题。
毫秒级的QoS风险则需要更多的分组缓存和较复杂的队列机制来应对,包括流分类、拥塞避免和队列调度技术,如加权随机早期检测(WRED)、严格优先队列(PQ)、低延迟队列(LLQ)、基于类的加权公平队列(CBWFQ)等。
秒级的QoS风险靠缓存和队列技术难以解决。设备的缓存有限,很难缓存数以秒计的分组,尤其是大容量的高速路由器和交换机应用。秒级的QoS风险需要网络级的接纳控制来解决,即在秒级时间长度的业务拥塞出现或预判即将出现时,在业务接入点上通过策略定制拒绝接入部分业务,避免高速路由/交换设备上出现超出处理能力的拥塞流量从而导致大量丢包。
分钟级的QoS风险往往由突发的业务量增加引起。采用接纳控制技术丢弃业务降低了业务接通率,增加了呼损,并且电信网络不允许这种状态持续数分钟以上,因此分钟级的QoS风险需要有其他的解决措施。目前已有的解决方案技术是流量工程和资源预留,即在分钟级时间长度的拥塞出现或预判即将出现时,通过人工或者策略服务器自动方式,采用流量工程技术将部分业务疏导到空闲的链路上,绕开拥塞点。由于流量工程隧道的部署决策需要时间,部署也需要时间,所以不能取代接纳控制技术,作为短时间拥塞控制技术的替代,以避免频繁的网络动荡。
更长时间的QoS风险就说明网络规划流量和网络流量不匹配,不再是哪一种QoS技术手段能解决。针对这样的QoS风险,需要运营商通过网络性能测量,采取明确针对性的网络扩容手段来解决。
需要注意的是,微秒级、毫秒级、秒级、分钟级等均是宽泛的时间范围,是相对概念,如毫秒级QoS风险,其拥塞时间长度上限是由设备能够处理的时间长度和业务可以允许的QoS容限决定的,而分钟级所指的时间长度下限与实际网络流量工程决策时间、业务呼损容限有关。
2 调度和队列技术
调度和队列技术在流量突发时缓存分组以避免分组丢失,当突发流量时间长度超过缓存指标而溢出时,策略地丢弃超出缓存处理能力的分组,以降低优先级业务的损失,或者以接续中的业务允许范围内的损伤为代价,处理微秒级和毫秒级的QoS风险。
部署调度和队列技术增加了分组的时延和抖动,减轻了因为拥塞而可能引起的丢包的影响,即在丢包、时延、抖动3项指标之间折中,使得网络的QoS指标控制在业务需求的范围之内。 |