您好,欢迎来到华佗小知识。
搜索
您的当前位置:首页一种新的主动队列管理自适应PI算法

一种新的主动队列管理自适应PI算法

来源:华佗小知识
维普资讯 http://www.cqvip.com

第21卷・ 第6期 电子测量与仪器学报 JOURNAL oF ELECTRoNlC MEASUREMENT AND INsTRUMENT If.21Ⅳ0.6 14 ・ 2007年12月 一种新的主动队列管理自适应PI算法 王明文朱清新 卿利 (电子科技大学计算机科学与工程学院,四川成都610054) 摘要:为克服PI算法所存在的响应速度慢,对网络参数变化敏感的缺点,将神经网络理论引入主动队列管理的研究中, 提出一种基于单神经元的主动队列管理算法NPI(Neuron based PI)。NPI算法将PI控制器看成是二输入的ADALINE神经 元,控制器的比例系数和积分系数按照LMS算法进行在线调整,对网络状态的变化有自学习能力,使队列长度能够快速收敛 到目标值,并增强了队列的稳定性。仿真试验结果表明NPI算法比PI有更好的性能。 关键词:拥塞控制,主动队列管理,PI算法,神经元 中图分类号:TP301.6 文献标识码:A 、New Adaptive PIAlgorithm for Active Queue Management Wang Mingwen Zhu Qingxin Qing Li (School of Computer Science and Engineering,University of Electronic Science nd aTechnology of China,Chengdu,610054,China) Abstract:PI is a famous active queue management algorithm,but its response is sluggish under heavy conges- tion,and static parameter setting causes PI sensitive to the network status.To overcome the shortcoming of PI atgo— rithm,a new AQM scheme,Neuron based PI,is described in this paper.NPI looks PI controller as an ADALINE with two inputs,and the proportional factor and integral factor of he conttroller are adjusted online using LMS algo- rihm.NPIt can lead to the convergence of the queue length to the desired value quickly and maintain the oscillation smal1.The simulation results show that NPI has better performance than PI. Keywords:congestion control,Active Queue Management(AQM),PI controller,neuron. 在IP网络中,主动队列管理(AQM)技术被用 于缓解网络拥塞问题,提供服务质量_1 J。IETF推荐 使用RED(Red Early Detection)[2j作为主动队列管 件改变时,这种自适应AQM算法仍然呈现较大振 荡。 为解决PI算法存在的这些问题,本文引入神经 网络控制理论,设计基于单神经元的有自适应能力 的主动队列管理算法,所获得的新算法称为NPI (Neuron based PI)算法。NPI算法使用单神经元, 理机制的实现算法。RED对参数的配置非常敏感, 并且存在响应速度与稳定裕度之间的矛盾。为了克 服RED存在的这些问题,文献[3]将AQM设计成 PI(Proportional—Integra1)控制器,但是PI算法对 通过对比例环节和积分环节加权系数的调整来实现 自适应,自学习功能。加权系数的调整采用LMS (Least Mean Square)算法。NPI算法解决了PI算法 不易在线实时整定参数,对网络状态变化不能及时 响应和对复杂的TCP/AQM系统难以有效控制等不 足。在NPI控制下,丢弃概率不是平滑变动的,能够 砌=-I’(Round Trip Time)等网络参数的变化比较敏 感;另一方面,虽然PI算法消除了“稳态误差”,实 验发现该算法也使系统的反应速度减慢 。近期 提出了许多自适应AQM算法,包括Adaptive PI 和 STAQM_5 等。然而,当TCP连接数和链路容量等条 本项目为国家“863”高技术研究发展计划资助项目(编号:2005AA1 1403O)。 本文于2006年10月收到。王明文:博士生;朱清新:教授,博士生导师;卿利:博士生。 维普资讯 http://www.cqvip.com 第6期 一种新的主动队列管理自适应PI算法 ・ 15 ・ 更好的对突发流和非响应流的干扰进行响应。 1 PI算法缺陷 设 为采样频率(Sampling Frequency),PI算法 在每一个采样周期T=1/fs,按下式计算队列的分组 1 丢弃概率 : P(n)=p(n一1)+a[q(n)一q r]一b[q(n一1)一q ] 其中,a和b为常数,g ,为队列长度调整的目标值。 根据设计准则 J,当链路容量,TCP连接数和R1vr 等网络参数已知时,可以确定a和b的值以使得系 统稳定。然而,由于控制系统有较大的相角裕度 (phase margin),其响应速度比较迟缓。文献[6] [7]分析了PI控制器的响应时间。设系统在稳定 状态下的分组丢弃概率为P ,队列容量为B,则PI 控制器的响应时间R ,的下界可由下式计算: …71 >一————— ———一 一(B—q r)(a—b) 在PI算法中,上式的各参数是固定不变的,因 而其响应时间也就不能随着网络状态的变化而自行 调整。PI算法的参数固定不变的另一个缺点在于 算法对网络状态的变化比较敏感,当链路容量,TCP 连接数,和R1vr等网络状态变化较大时,TCP/PI系 统性能将变坏,振荡加大,甚至使得系统不稳定。 NPI算法引入神经元,利用神经元自学习的特点,改 进了控制器对网络参数变化的适应性。当网络参数 变化时,通过神经元的在线学习,相应调整PI控制 器参数,达到自适应的目的。仿真试验结果证明,该 方法是有效的。 2 NPI算法设计 2.1线性自适应神经元 神经元是构成神经网络的基本单位,具有自学 习和自适应能力,而且结构简单易于计算。自适应 线性神经元(ADALINE,ADAptive Linear NEuron)采 用线性函数作为传输函数,学习规则为LMS算法。 图1为一个具有Ⅳ个输入 , …, 的自适应线 性神经元,输出为 +b (1) 其中W (i=1,2,…,Ⅳ)和b是权值。 神经元通过对权值的调整来获得自学习能力。 图1 自适应线性神经元 ADALINE神经元采用了LMS算法作为学习规则, 这是一种近似的最速下降法。设目标函数为 F( ),其中 为权值向量。目标函数的梯度为 V F,则LMS算法采用下式进行神经元的学习: (n+1)= (n)一 V F (2) 其中 为学习速度。 由(1)和(2)可知LMS算法具有自适应的特 点,因而可以很好的用于自适应控制。为了对PI算 法的a和b参数进行在线自适应调整,我们借用 LMS算法思想,将PI控制器看成一个简单的两输入 的ADALINE神经元,通过神经元的自学习过程达 到调整PI参数的目的。 2.2 NPI算法 离散形式的PI控制器规律可以表示为: p(n)=p(n一1)+ 却( )+ (却( )一曲( 一1) (3) 其中, 为比例系数, 为积分系数,却(n)=q(n) 一g ,。比较(1)式和(3)式,有: =a—b, =b (4) 令 ap(n)=p(n)-p(n一1), l=却(n), =却(n)一曲(n一1)。 可以将PI控制器看成是输入为 和 ,输出为 ap(n)的两输入ADALINE神经元。 和 为神经 元的权值,按LMS算法进行在线调整。单神经元自 适应PI控制结构如图2所示。 图2 单神经元自适应PI控制结构 为了使TCP/AQM系统获得良好性能,AQM控 制器需要将队列长度q稳定到目标值q 因此,在 维普资讯 http://www.cqvip.com ・ 16 ・ 电子测量与仪器学报 2007年 单神经兀PI控制器中引入二次型性能指标如F: -,(n)= g(n)一g ] (5) 因为由式(5),有 鱼 ( ± )=鱼 ( ± 2 垡 :± 2 a (n) Oq(n+1)a (n) =却( ) 丽op(n) =却(n+1) 。 同理可得 旦吾 =却(n+・) z旦 则 V J(n+1)= 设J(n)的梯度为VJ(n),则由(2)式得到: (n+1)= (n)一 却(n+1) 。 岛 (6) ( )=Kt( 枘(川) (7) 其中 和.,7,为学习步长。式(6)和(7)的ag(n+ 1)/印(n)未知,我们用符号函数sgn[Oq(n+1)/Op (n)]来代替。产生的误差可通过调整学习速率来 修正。 为了使TCP/AQM系统稳定,式(6)和(7)调整 权值时必须要使性能指标收敛,下面的定理保证了 系统的收敛性。 定理1:设队列容量为B,目标队列长度为g , 由式(3),(6)和(7)决定的AQM算法中,如果 和 满足 。< ≤ 2 而㈩ 0< t , 1 丽nLq L 一g  一1,Jn丽 f (9) 则目标函数(5)必收敛。 证明:令 AJ(n+1)=-,(n+1)一-,(n) =÷[(e,q(n+1)) 一(却(n)) ] Aq(n+1)=却(n+1)一却(n) 由微分中值定理及式(6)有 △g(n+1)=宣 (n) =一 却(n+1)[ ] 于是 AJ(n+1)=÷[(土 l^ 晖喜I土  \、 ●● ●●/ 却(n)+Aq(n+1)) 一(却(n)) ] = g(n+1)[26q(n)+Aq(n+1)] =丢 [却(n+1) ] [一2+ ( 为了保证目标函数收敛,必须满足△-,(n+1)<0,即 有 _2+ ( <0 再由式(6)并代入符号函数,得到 0<fly<2/( )2=2/ 训 同理可得 0<.,7,<2/( ) =2/[q(n)一q(n-1)] 所以,当式(8)和(9)成立时,上面两式必成立, 从而目标函数收敛。 由(8)和(9)显然有 0<fly.rh<-- Ry (1o) 在实际的配置中,可以将 和.,7,都设置为 2/B 。但是为了获得更好的控制效果,由于 max E q ,(B—qr,f) ]> ma x{maxEq ̄f2,( ) 一qref) ]t maX[qr ̄2,(B—g ) ]> nlax-2.{[g(n)一q(n一1)] t …可取 和.,7,为2/[max(g ,B—g )]2 o进一步, 如果考虑到AQM控制器的目标是要将队列长度稳 定的控制在g 在实际应用中,在稳定状态下,队列 长度的振幅平方不会超过min[g ,(B—g ) ],因 此取.,7,为2/min[q ,(B—g ) ]。 为了使算法快速稳定,权值 和 的初始值 的设定很关键。考虑到PI算法有良好的稳定性能, 我们通过式(4)来设置 和K,的初始值,参数口和 b按照PI算法的设计准则确定,取样频率同PI算 维普资讯 http://www.cqvip.com 第6期 一种新的主动队列管理自适应PI算法 ・ 17 ・ 法。因此,由PI算法的稳定性和定理1可知NPI算 法是稳定的。试验表明NPI算法比PI算法有更好 的稳定性和快速的响应性。 为了使NPI有更好的灵活性,我们给神经元增 加一个比例系数k,则(3)式变为: P(n)=p(n一1)+k[ 酗(n)+Kl(酗(n) 一6q(n一1)] (11) 对k设置不同的值可以控制权值 和 的调 整幅度,从而控制丢弃概率P(n)的变化幅度。试验 表明增加k值可以提高NPI的响应速度,但是过大 的k值会带来分组丢弃率的增加,使队列长度q过 低,从而降低链路吞吐量(throughput)。我们的推荐 值为1 k--<4。 3仿真试验 下面我们用仿真试验来研究NPI算法性能。采 用NS一2网络仿真平台,网络的拓扑结构如图3所 示,具有单瓶颈链路。业务源分为FrP,UDP和HT— TP三种,在不同的试验中启动相应的业务源组合, 双向传输时延为200ms。节点A的队列为PI,队列 容量为400packets,目标队列长度为175packets,分 组大小为500bytes。以下试验均持续200s。 TcP{ UDP{ 图3仿真网络拓扑结构 试验1.网络重负载下NPI算法性能 当网络负载较重时,AQM需要将队列长度快速 的控制到目标值。考虑1000个持久TCP/Reno连 接,窗口大小为1000packets,使用ffp业务源,所有 连接在0.1S时同时启动。按照PI设计规则 ,相 应的系数配置为: a=1.88877393e一006.b=1.86998016e一006 取样频率为296Hz。 NPI算法中, 和 的初始值按照式(4)设 置。为了考察NPI的控制能力与式(11)中比列系 数k的关系,分别取k的值为2和4。根据定理1, 学习步长 设置为 ~max[—q2,(B—-—q ̄f)2] 2 2 52=3・9506e一5 r ̄ t而将'7,设置为 丽 意 ・5306e e 200 j 、 0 时间(秒) 图4试验1.PI的时变队列长度 图4是配置PI算法的试验结果,响应速度非常 迟缓,在试验开始近100s的时间内保持满队列。而 NPI算法的响应速度则明显快于PI算法(图5),当 k=2满队列时间仅为50s,当k=4满队列时间缩小 到25s左右,大大改善了PI算法的性能。NPI算法 可以将丢弃概率尽快调整到其稳定值(图6,图7), 从而使队列长度q快速的控制到目标值q 在NPI 算法下,丢弃概率的调整更能适应网络状态的变化。 互 三 % 、 200 0 I I : I 互 1j 三 暑 、 , ; ・ 1 0 0 100 时间f秒) (I ) 图5 试验1.NPI的时变队列长度, (a)k=2;(b)k=4 维普资讯 http://www.cqvip.com

・ 18 ・ 电子测量与仪器学报 2007年 0.2 瓣 \ O O 100 时间(秒) 图6试验1.PI的时变丢包概率 僻 \ 图7试验1.NPI的时变丢包概率,k=4 试验2.非响应UDP流和TCP短连接干扰下 NPI算法性能在实际的Internet连接中,通常包含大 量的TCP短连接,以及非响应UDP流。PI算法是 基于TCP/queue系统建立的控制器,因此非响应 UDP流和TCP短连接的干扰将影响PI控制器的性 能。为了使模拟流量更接近网络的实际流量,我们 在试验中使用FTP。HrrrP和UDP的混合业务流。 使用200个TCP持久连接和200个HTrP会话。试 验开始时启动50个UDP流,使用CBR业务源,然 后在30s停止所有的UDP流。在PI算法的控制下, 队列保持长时间的满队列,而在UDP连接停止时变 为空队列(图8)。NPI算法性能有明显的改善,满 队列时间远远短于PI算法(图9)。而且能够快速 的将队列长度稳定到目标值。 ∞ . 200 O O 100 200 时间(秒) 图8试验2.PI的时变队列长度 400 200 毯 O 时间(秒) 图9试验2.NPI的时变队列长度k=4 4 结 论 主动队列管理是近期网络技术研究的热点。针 对PI控制器所存在的响应速度慢的缺点,本文引入 神经网络理论对该算法进行改进。所得到的NPI算 法动态调整比例和积分系数,对网络状态的改变有 自适应能力,同时保持了计算简单快速的特点。我 们给出了一组仿真试验结果,表明NPI算法在响应 性和稳定性上优于PI算法,能够更好的适应网络状 态的变化。 参考文献: [1] R Ryu,D Cheney,H W Braun.Internet flow character- ization:Adaptive timeout strategy and statistical modeling [C].In:Proceedings of passive and active measurement workshop,Amsterdam,Netherlands,2001:94—105. [2] S Floyd,V Jacobson.Random early detection gateways for congestion avoidance[J].IEEE/ACM Trnas on Net— working,1993,1(4):397—413. [3]C V Hollot,V Misra,D Towsley,W B Gong.On desig— ning improved controllers ofr AQM routers supporitng TCP lfows[C].In Proceeding of INFOCOM 2001:1726— 1734. [4]Hong,Y,Yang,O W W.Design of na adaptive PI rate controller for streaming media traffic based on gain and phase margins[C].IEE Proceedings of Communica— tions,2006:5—14. [5]H Zhang,C Hollot,D Towsley,V Misra.A self—tuning structure for adaptation in TCP/AQM networks[C]. IEEE GLOBECOM 2003:3641—3646. [6] Li,Y.,Ko,K ,Chen,G.R..Trnasient behaviour 0f PI—contorlled AQM[J].Electronics Letters.2006. 42(8):494—495. (下转第35页) 维普资讯 http://www.cqvip.com

第6期 三维激光扫描测量系统标定方法研究 ・ 35 ・ laya,R.Alamus,and E.Bosch,Integration of a [2] J.TaTerrestrial Laser Scanner with GPS/IMU Orientation Sen [7] 丁振良.误差理论及数据处理[M].哈尔滨:哈尔滨 工业大学出版社,1987. sots[C].ISPRS Istanbul Turkey,2004,7:12—23. d A.Forsyth and Jean Forsyth,计算机视觉——一 [3] Davi作者简介: 种现代方法[M].北京:电子工业出版社,2004. [4] Qurban Memony,Sohaib Khanz,Camera calibration and three..dimensional world reconstruction of stereo..vision U.. 余祖俊:男,1968年出生于湖北宜 昌。现为北京交通大学机电学院教授, 主要研究方向为测控技术。 sing neural networks,International Journal of Systems Science[J].2001,32(9):1155—1159. [5] 宣雷,徐建华.摄像机参数的测定方法与参数估计 [J].模式识别与人工智能,1993,6(1):67—70. [6] 邓正隆.惯性技术[M].哈尔滨:哈尔滨工业大学出 版社,2006. (上接第18页) en F Y,Lin C,Ying X H,Shan X M,Wang F B.A作; Robust Active Queue Management Algorithm Based onSliding Mode Variable Stuctrure Control[C].IEEE INF- COM,2002:13—20. 震豳   i(上接第21页) 52(10):4481—4496 [4] Mackay D J C,Postol M S.Weakness of Margulis and Ramanujan—Margulis low density parity—check codes[J]. Electronic Notes in Theoretical Computer Science,2003, 74:1—8. 作者简介: [5] Varnica N.Iteratively decodable codes for memoryless and intersymbol interference channels『D].Ph.d Thesis. Cambridge,Massachuseus,2005:109—142. 缪德山:男,1978年出生,北京邮电 大学博士研究生,主要研究方向为宽带移 动通信,信息论及编码。 [6] M-R Sadeghi,A H.Banihashemi,and D Panario.Low- density parity check and lattice:Constructions and De-coding analysis[J].IEEE Trans Inform Theory,2006, 

因篇幅问题不能全部显示,请点此查看更多更全内容

Copyright © 2019- huatuo0.cn 版权所有 湘ICP备2023017654号-2

违法及侵权请联系:TEL:199 18 7713 E-MAIL:2724546146@qq.com

本站由北京市万商天勤律师事务所王兴未律师提供法律服务