您好,欢迎来到华佗小知识。
搜索
您的当前位置:首页网构软件的Wright-Fisher多策略信任演化模型

网构软件的Wright-Fisher多策略信任演化模型

来源:华佗小知识
软件学报ISSN 1000—9825.CODEN RUXUEW Journal ofSoftware,2012,23(8):1978—1991[doi:10.3724/SP.J.1001.2012.04155] @中国科学院软件研究所版权所有. E・mail:jos@iscas.ac.cn http://www.jos.org.en Te1/Fax:+86.1 0,62562563 网构软件的Wright-Fisher多策略信任演化模型 印桂生,王莹洁 ,董宇欣,崔晓晖 (哈尔滨工程大学计算机科学与技术学院,黑龙江哈尔滨 150001) Wright--Fisher Multi・-Strategy Trust Evolution Model of Internetware YIN Gui-Sheng,WANG Ying-Jie ,DONG Yu—Xin,CUI Xiao—Hui (College ofComputer Science and Technology,Harbin Engineering University,Harbin 150001,China) +Corresponding author:E—mail:towangyingjie@163.com Yin GS,Wang YJ,Dong YX,Cui XH.Wright—Fisher multi-strategy trust evolution model of internetware. Journal ofSoftware,2012,23(8):l978一l991(in Chinese).http://www.jos.org.cn/lO00—9825/4155.htm Abstract: Internetware is an abstract of software system in open network environment.Its trust relationship iS one of the most complex social relationships.In order to enhance adaptability of trust evolution model,improve prediction accuracy about trust evolution,and restrain production of selfish nodes effectively through discriminatory service and evolutionary game theories,this paper puts forward a trust evolution model that corresponds with characters of an open network:(1)Global profit function of entities based on discriminatory service is gained for enhancing adaptability of trust evolution model;(2)With the help of evolutionary game theory, and based on characters of Wright—Fisher model,a kind of Wright—Fisher multi—strategy trust evolution model of intemetware is proposed for enhancing the prediction accuracy about trust evolution;(3)According to principle of fairness,incentive mechanism based on game is built,SO as to inspire evolution of tustr strategy and restrain production of selish nodes efffectively.The experimental results show that this model can more accurately reflect complexity character of open network.By adding incentive mechanism,internetware system can achieve the stable state more quickly,thus it can improve the eficiency of fnetwork more effectively and make the trust profit achieve optima1. Key words: internetware;discriminatory service;evolutionary game;Wright--Fisher;multi・-strategy;trust evolution;incentive mechanism 摘一要: 网构软件是开放网络环境中软件系统基本形态的一种抽象,其信任关系本质上是最复杂的社会关系之 _为了增强信任演化模型的自适应性,提高预测的准确性以及有效地抑制自私节点的产生,结合差异化服务和演化 博弈理论,提出了一种符合开放网络特征的信任演化模型:(1)建立基于差异化服务的实体全局收益函数,以增强信 任演化模型的自适应性;(2)以演化博弈理论作为分析5-具,借助Wright—Fisher模型的特点,提出了一种Wright— Fisher多策略信任演化模型,以增强对信任演化预测的准确性;(3)根据“公平规范”原则建立了基于博弈的激励机 制,激励信任策略的演化,从而有效地抑制自私节点的产生.实验结果表明:该模型能够更准确地反映开放网络中实 ・基金项目:国家自然科学基金(60973075,61100007);黑龙江省自然科学基金(F200937,F2011l0);哈尔滨市自然科学基金 收稿时间:2011-05.31;修改时间:2011-08.09;定稿时间:2011—1l。17 (RC2009xK叭0003);哈尔滨工程大学基本科研业务费专项  ̄(HEUCF1015,HEUCF100605) 印桂生等:网构软件的Wright—Fisher多策略信任演化模型 1979 体信任行为的复杂性特点;在激励机制的作用下,网构软件的信任演化能够更快地达到稳定状态,从而有效地提高网 络的效率,使网构软件系统的信任收益达到最优. 关键词: 网构软件;差异化服务;演化博弈;Wright—Fisher; ̄;策略;信任演化;激励机制 中图法分类号:TP31 1 文献标识码:A 传统的软件形态是采用自顶向下的分析方法进行开发的,其实体的封闭性难以适应开放网络环境中的动 态、多变和复杂情况的要求….因此,研究者提出了一种新的软件形态——网构软件.网构软件是在Internet开放、 动态和多变环境下软件系统基本形态的一种抽象,是传统软件结构的自然延伸.网构软件的显著特征是自主 性、协同性、反应性、演化性以及多态性[2,31.它能够感知外部环境的变化,按需动态调整实体问交互模式,在线 完成复杂任务.在网构软件系统演化过程中,人们往往希望通过有效手段控制网构软件实体行为及交互策略的 选取,以使系统快速地收敛到目标状态.传统的解决方案旨在通过信任度量的方法,衡量实体的综合信任度来为 实体交互策略的选择提供决策支持.整体上网构软件系统呈现出从“无序”到“有序”的自组织过程I4】.近几年,一 些学者开展了对开放网络实体信任行为的演化性、复杂性以及模糊性的研究,这些研究成果有效地推动了动态 信任演化预测理论研究的发展,极大地丰富了人们对动态信任演化的进一步认识.但通过深入分析我们不难发 现,目前研究中仍然存在一些问题,还没有引起学者们足够的重视: (1)现有的信任演化模型在计算实体的信任收益时,大多采用专家意见法或者平均权值法等主观的融合计 算方法,没有将网络环境中复杂的信任属性考虑到信任收益的计算中,影响了信任决策的科学性;而且缺少灵活 性,一旦权值确定,将在实际应用中很难由系统动态地去调整它,致使信任演化模型缺少自适应性[5】. (2)目前在对系统的信任演化进行预测分析时,大多是针对两策略的信任演化进行博弈分析的,即“完全信 任”和“完全非信任”策略;而在具有开放性复杂的网络环境中,实体的信任行为是具有多样性和模糊性的,因此, 以往的信任演化模型的两策略博弈分析并不能反映出真实的网络情况,导致模型对系统信任演化的预测分析 具有局限性以及缺少准确性. (3)网构软件实体的固有理性是希望最大化自己的效用,同时最小化其他实体的效用,因此导致自私行为 主导了整个网构软件信任演化方向,即产生了free.riding问题l6 ].这使得“非信任合作”策略成为某些软件实体 的首选策略,导致网络效用的降低,从而产生了实体收益与系统整体收益相互冲突的问题.实体的这种固有理性 严重地影响了网构软件系统的整体平衡,降低了网构软件系统的总收益和总体运行效率.因此,人们希望通过有 效的手段对该博弈过程进行收益的控制,使得在多次博弈的策略演化过程中,“信任合作”策略成为实体首选策 略,从而确保系统的整体收益最优. 针对上述不足,本文结合开放网络的复杂性特点,提出一种差异化服务下网构软件的Wright.Fisher多策略 信任演化模型【9, 】,并在此基础上建立相应的激励机制,从而提高网络的使用效率,使网构软件系统的信任收益 达到最优,提高系统的整体可信度. 本文第1节介绍一些研究工作的相关进展.第2节给出信任演化基本框架的描述.第3节根据差异化服务 原理来确定实体信任的全局收益函数的计算模型.第4节根据生物学中的Wright.Fisher理论以及多策略博弈方 法提出一种Wright.Fisher多策略信任演化模型.第5节提出一种基于博弈的激励机制.第6节对该信任演化模 型进行模拟实验和结果分析.第7节对全文进行总结,并且提出进一步的研究计划. 1相关工作分析 近年来,国内外学者研究和发展了不同的信任演化全局收益函数的计算模型,从核一tl,思想上讲,目前学者们 对信任收益函数的研究主要集中在基于虚拟支付和基于信誉的这两种收益函数的计算模型上. (1)虚拟货币 是类似于经济学中市场调节的方式,将收益转化为虚拟货币.虚拟支付通过发行虚拟货币, 利用一个可计费的体系结构来跟踪各种各样的交易,并采用虚拟支付的手段向消费服务的实体收费.在该机制 中,每个实体的下载量和上传量分别划分为3个等级,而实体的效用则由下载量、网络带宽、空间消耗等参数 1980 Journal ofSoftware软件学报go1.23,No.8,August 2012 来表达.这种模型的优点在于可靠性较强,但需要服务器来负责发行货币,分配和流通等,因此存在服务器 瓶颈问题.该模型除了可行性较差以外,对隐藏信息问题和信息不对称问题的研究还不够深入. (2)信誉机制l1 】是一个等级的概念,即实体根据自己在网络中的历史行为情况,获得由网络中与邻实体 所评价得出的信誉值.在以后的服务和交易中,其他实体均根据请求实体的信誉值给予对应等级的回应.该机制 将某一实体对其他实体的贡献值分布式地存储于其他实体的历史记录中,该实体在以后的交易中凭借自己先 前对网络做出的贡献获得其他实体提供的资源.但该机制需要从第三方获取信息,因此存在着信息的可靠性问 题和对信息提供实体的信任问题.此外,如何减少实体问的共享交易记录、信誉等产生的大量开销以及这些信 息如何共享也是需要解决的关键问题. 在系统信任演化模型的研究方面,其研究方法主要是集中在演化博弈l1 5]及神经网络等理论研究工具上,其 原理都是使实体以一定的学习准则进行学习.即如果实体做出错误的行为,则通过网络的学习,应使实体减少下 次犯同样错误的可能性. (1)复制者动态方程是在演化博弈理论中运用最为广泛的选择机制动态方程,它表征演化博弈稳定状态的 动态收敛过程.复制者动态方程的建立是演化博弈理论正式形成的标志.许多博弈理论家对群体行为调整过程 进行了深入研究,从不同角度提出了各种动态模型,如Weibull提出的模仿动态(imitation dynamics)模型;Brgers 和Sarin[ 】提出的强化动态(reinforcement dynamics)模型.迄今为止.演化博弈研究者提出的基本思想都是源自 Taylor和Jonker[ 7J以及Smith的研究成果.在复制者动态方程中,纯策略的增长率与相对支付或适应度成正比. 复制者动态方程作为信任演化模型,增加了信任行为可信的新方法,强化了对网络状态的动态处理,为实施自适 应、鲁棒的可信网络提供策略基础.目前,复制者动态方程被广泛地应用在系统演化的动力学模型中,对它的一 些变形也是学者们研究系统演化动力学模型的热点问题. (2)神经网络的发展使得其广泛应用于工程领域和经济研究中.Horie将神经网络结合博弈论中的Nash均 衡概念应用到联想记忆中.Chong等人[18,19】利用神经网络对重复的囚徒困境进行了研究,对行为进行策略的描 述并且建立演化模型.de AraOjo等人L2 uJ用神经网络来模拟有限理性条件下的市场模型,将市场环境中每个代理 人作为一个神经网络,并通过演化算法来学习.在演化方面,文献[21】将神经网络引入到演化博弈中,通过神经网 络来模拟有限理性博弈人的学习和策略调整过程,并采用粒子群优化算法对神经网络进行训练,使神经网络具 有演化学习的能力.该研究使得神经网络成为系统演化分析的有力工具,同时也为信任演化模型的研究增添了 新的方法. 虽然这些最新的研究工作有效地推动了信任演化模型的发展,但仍然存在缺少自适应性、具有局限性以及 缺少准确性等问题.所以在该领域的研究中,应该结合以上研究方法的优点来考虑创建网构软件信任演化模型, 使其更加符合开放网络环境中实体信任行为的复杂性特点,从而使得信任演化模型能够更加准确地拟合出实 际网络中实体信任行为的演化过程,大幅度地提高模型对信任演化的预测能力.因此,本文根据开放网络复杂性 的特点,将网络中复杂的信任属性进行量化,根据实体的不同信任行为对实体进行差异化服务;在此基础上,建 立基于Wright.Fisher多策略信任演化模型,该模型同样考虑到复杂的网络特性,结合以往的信任演化模型的优 点对网构软件的信任演化进行分析预测,并对其信任行为进行有效的激励,从而提高系统的演化效率. 2 网构软件信任演化基本框架描述 网构软件信任演化过程是一个循环、求精的过程.首先,根据实体信任行为的收集以及信任属性分析来对 实体进行差异化服务,计算不同信任等级下实体的全局收益;然后,通过演化博弈来预测分析系统信任演化趋 势;在此基础上,建立实体信任演化的激励机制,从而激励实体信任策略的选择,并将该结果反馈到信任证据的 收集.该过程循环往复地执行,最终使得系统达到稳定的可信状态.因此,可以用图1所示的信任演化框架来描述 这一过程. 1982 Journal of Software软件学报Vo1.23,No.8,August 2012 实体的信任度,确定一个实体的收益值是差异化服务机制中一个重要的组成部分.其中,网络实体对服务质量的 要求主要有:带宽、延时、延时抖动、包丢失率、搜索范围、访问和下载优先级等信任属性. 本文针对网构软件中不同信任等级的实体进行全局收益函数的计算,其本质上是根据实体信任行为的历 史信息,系统对实体进行差异化服务来协调实体之间的信任合作行为.对于信任等级较高的实体,系统为其提供 更高的服务优先级;反之,对于信任等级较低的实体,系统将为其提供较差的服务,以达到惩罚不可信软件实体 的目的.基于这种差异化服务的理论基础,本文根据网络中的不同信任属性对实体信任策略选择的影响,有针对 性地调整其服务质量,从而确定不同信任等级的全局收益函数. 3.2差异化服务下的信任实体的全局收益函数 由于网络中的每个实体都希望最大限度地从系统中获益,系统中实体之间既相互协作又相互竞争,而博弈 双方对系统资源的竞争结果是稳定的,即达到Nash均衡 .因此,本文提出基于差异化服务的收益函数计算模 型,并且将博弈论引入到差异化服务中,将网络环境中的各个信任属性进行量化,使其成为全局收益函数计算模 型中的各个信任参数. 本文通过参与者之间的相互博弈,计算出参与者基于差异化服务的全局收益.该方法不仅将网络环境中的 重要信任属性考虑到实体的全局收益函数计算模型上,而且考虑了实体之间的相互影响,因此将差异化服务、 博弈论的思想引入到全局收益函数的计算模型上,使得系统在对实体的信任等级的确定上具有更高的适应性、 灵活性和可扩展性. 假设系统中有Ⅳ个参与者分别表示为Pl,P2,...,尸Ⅳj则令D 表示参与者 的贡献量.为了方便说明,定义一个 无量纲di: di=Df,Do (1) 其中,D0是一个系统常量,它由系统设计者设定,在这里将其设为系统参与者至少贡献的资源量,即最小贡献量. 则di被定义为P 个人资源的贡献. 在网构软件系统中,每个实体的贡献都会服务于系统中的其他实体;但对于不同的实体,服务质量和数量都 不相同.设定b。,表示为实体P,对实体 的影响值,即影响因子.如果 对P『的贡献不感兴趣,则6 0.一般认为, 对于任意实体P ,有6 >10 b=O.由于软件实体之间的依赖关系通常具有单向性,即实体问的影响程度不具有对 称性,因此影响因子bij ̄bjf. 差异化服务的基本规则是:系统根据实体的贡献来回报他们.一个简单的实现方案如下:系统接受实体P 请 求的概率为p(di),则拒绝的概率为1-p(di).如果尸l的贡献较小,那么其请求就很可能被拒绝,则系统接受 请求 的概率p(di)为 ,jr P(di)=— — ・——一 (2) N1 ∑d +妒J氧≠}J 公式(2)满足 ( =0)=O.即当实体的贡献为0时,其被接受的概率也为0;反之,当实体的贡献 不断增大 时 ( ) 1.指数研表示实体只的信任度,当实体的信任度嘶较小时,则实体被拒绝的概率较大;反之,实体被拒绝 的概率较小.其中,实体的贡献度和实体的信任度大小成正比,即贡献度越大,则相应的信任度也越大. 收益函数 用于刻画实体的全局收益,不同的信任等级具有不同的全局收益函数.因此,根据以上分析,就可 以得到实体 的效用函数U 为 =一di+P(di)∑bodj, f 0 j=l (3) 其中,“一di"表示实体P 所要付出的代价.实体Pl的获益不仅取决于自身的贡献量,还取决于其他实体的贡献量和 这些实体的贡献对于 的影响bf,以及实体 被系统接受的概率p(di). 由p( =0)=0和p(di=oo)=l可知,Uf有两个极限: 印桂生等:网构软件的Wright.Fisher多策略信任演化模型 1983 lim“ d _÷0_÷0 ,U-lim dd_+∞“ ’ (4) 可见,无限增大实体的贡献量 ,并不能无限地提高实体的收益 ,收益函数还取决于其他实体的贡献及其 对应的收益.直观地解释就是:参与者的贡献越大,得到的服务质量就越好:但是参与者从系统中得到的总收益 并不是随着其贡献的增加而无限增大的,而是有一个最大值,前提是有一个系统的临界值以,当 无限接近 时, 收益函数才有可能取到最大. 也正是由于收益函数最大值的存在,才会有实体希望提高自己的信任度以获得利益. 假设将实体信任划分为4个等级,分别为(1,2,3,4)这4个信任等级,其中,信任度依次降低,则根据公式(3),这 4个信任等级的全局收益l,ll,U2,U3,U4表示如下: U1:一dl+p(d1)(bl2d2+6I3d3+6l4d4), U2=一d2+p( )( 1 + 3以+ 4d4), U3=一d3+p(d3)(63ldl+6]2d2+6]4d4), U4=一d4+p(d4)(641dl+642d2+643d3). 根据以上分析可以看出,将博弈引入差异化服务中,利用差异化服务建立全局收益函数的计算模型,可以将 环境中的各种因素作为参数变量添加到计算模型中,从而提高模型的灵活性和自适应性.通过这种方法,可以建 立更加复杂和完善的全局收益函数计算模型. 4 Wright—Fisher多策略信任演化模型 4.1两策略Wright.Fisher过程模型 Wright.Fisher过程为演化博弈理论中的重要过程,可以将它分为3步: (1) 选择,即根据各种类型在总体中的适应性强弱,随机选择个体用来繁衍下一代; (2)繁殖,即根据选择结果繁殖出下一代; (3) 产生的下一代替代随机选择的一个个体. Wright.Fisher过程具有广泛的使用范围,它进行的是同步更新,即所有个体根据适应性的强弱同时产生后 代,得到一个后代集合,而更新后的下一代则从这个后代集合中随机产生1 . 下面以网构软件中的(信任,非信任)两策略收益矩阵为例,介绍Wright.Fisher过程的模型.表1为2x2对称 博弈的收益矩阵. Table 1 Payoff matrix of 2x2 symmetrical game 表1 2x2对称博弈的收益矩阵 假设网构软件实体总数为M其中已经有 个信任类型的个体存在,则信任和非信任两种类型在这个总体 中各自的收益,即其适应性分别表示为 R(Qi-1)+S(N-Qi),1一一・,’一一:_, : , Ic1口lf∈{信I任,上'非信任}1r1日I L‘f ,(、5)J, 』V—J 』V—l 又考虑其选择性因素,则根据遗传变异理论真正的信任、非信任类型的适应性分别为 F1=1-w+w ,F2=l-w+w'f2 (6) 其中,W为选择因子,反映了 和 在实际适应性中贡献的大小.当w=l时,为强选择博弈,说明该策略的选择是 最适选择,此时也称为完全选择,即选择不起作用. 由于Wright—Fisher过程是在后代集合中进行Ⅳ重的伯努利实验,故信任类型个体服从二项分布,假设y( ) 表示第n代信任类型个体的数量,y(,z)=Q ,则第n+l代信任类型个体的数量Y(n+1)= 的概率为 1984 Journal ofSoftware软件学报Vo1.23,No.8,August 2012 Pcyc,z+ = -ycn = =( ]( ; ] ( _ ; ] 一 , 信任,非信任,c7 4.2信任的多策略博弈模型 对于经典的两策略博弈,每个实体都只有两个选择:信任和非信任.两策略实体收益的信任博弈矩阵见表1. 本文在实体信任行为两策略博弈的基础上提出了网构软件实体信任行为的多策略博弈,根据前面的讨论,可以 得到具有不同信任等级实体的全局收益函数.因此,本节将对实体信任的多等级进行博弈,使其更适应复杂的网 络环境. 根据多策略重复博弈原理【 ,不同信任等级的实体相互博弈后,其具体收益值的计算函数如下: pA=2.5—0.5uA+2us,UA,UBE{Ul,U2,U3,U4} (8) 其中,U 和UB分别表示参与者 和参与者 的全局收益函数.该模型反映了不同信任等级实体相互博弈后的具 体收益值.以四策略的博弈为例,将信任分为4个等级:(1,2,3,4),根据以上的分析,四策略收益矩阵见表2.通过对 网构软件实体信任行为的博弈分析可知,多策略的收益矩阵亦为对称博弈矩阵,在动力学模型分析中,将该博弈 重复地执行,且在每个多策略博弈阶段结束时,任意参与者采取的策略作为历史信息能够被其他参与者所共知, 并且各参与者据此历史信息制定其在下…博弈阶段所采取的策略. Table 2 Payoff matrix of four strategies 表2四策略收益矩阵 信任策略 1 1 PAj1,p l 参与者B 2 p^2,p 2 3 p43,p 3 4 p44,p 4 2 PA21,p 1 p t,p8n p l,pB‘L p也2,p% p n'p8 1 p“2,p8 p 3,p 3 p 3,p8n p ¨’p8 p 24,p 4 p ,p p ¨,pB 参与者 3 4 本文在两策略博弈的基础上对网构软件实体的信任行为进行多策略博弈研究,对具有不同信任等级的实 体进行博弈,制定多策略的博弈规则,使得对网构软件实体信任行为的博弈分析更加符合开放网络环境下实体 行为复杂性的特点.本文在传统的信任、非信任两策略博弈分析的基础上,对实体的信任行为进行多策略博弈, 使得对网构软件实体信任演化的预测分析满足复杂开放网络环境下实体信任行为的特点,从而为网构软件信 任演化模型的进一步研究奠定基础. 4.3多策略博弈下的Wright.Fisher过程模型 第4.1节已经对两策略的Wright—Fisher过程模型进行分析,本节将在两策略的Wright—Fisher过程模型的基 础上来分析多策略的Wright.Fisher过程模型(以第4.2节分析的四策略为例). 假设网构软件系统中实体的总数量为 其中,(1,2,3,4)为信任的4个等级,设4个信任等级实体的初始数量 分别为Q ,Qz,Q3,Q4,则具有这4个信任等级的个体在这个种群中各自的收益,即适应性为 fI 己fi= p ] l—p 』V—l _}一,f, ∈{1,2,3,4} (9) 又考虑其选择性因素,则根据遗传变异机理,不同信任等级实体的真正适应性分别为 Fi 1一w+w ,f∈{1,2,3,4} (10) 其中,W的作用与两策略的Wright—Fisher过程模型中的选择因子作用相同,即反映 在实际适应性中贡献 的大小.同理,由于Wright.Fisher过程是在后代集合中进行Ⅳ重的伯努利实验,故不同信任等级的个体服从二项 分布.假设y( )表示第n代具有某个信任等级的实体数量, n)= ,则这4个信任等级实体第n代的数量分别为 Q ,Qz,Q3,Q4,第n+l代的数量分别为 , , , 的概率为 其 中 印桂生等:网构软件的Wright.Fisher多策略信任演化模型 : 1985 /,●●●●●、\ , P ycn+一 = lycn =Q/)=( ] ∑ i=1  一、 / 4.4信任演化模型 因为wright.Fisher过程的个体进行的是同步更新,因此利用图上博弈中鱼 来近似代替演化博弈中复  一制动态方程 的方法,其中,E( )为总体中某种信任类型个体频率的变化量,At为更新时问的步长.则根据以上 出一出 = 分析,E(△ )的计算公式为 E( )=垡 ——————————————一=:  堑 L— i 2荆3 4 ,∈{1,,,} ll : ,,( ) 12 ∑ - , 一 其中,Q 为第 代信任类型个体的数量, 为第n+l代信任类型个体的数量.设不同信任等级的实体所占总体的 比例分别为 :v, =x,导= =z,则由公式(11)、公式(12)可得差异化服务下网构软件的Wright-Fisher 多策略信任演化模犁: 出一出 = ,  .(13) 一 11=v(1一w+W’P 1)+ (1一w+W’p 2)+ (1一w+W。p4 3)+z(1一w+W。p 4) =V(1一w+W‘P 21)+ (1一w+W‘PA22)+ (1一w+W p 3)+z(1一w+W’p 4) =V(1一w+W。P 1)+ (1一w+W’p 2)+J,(1一w+w‘PA33)+z(1一w+W‘PA34) (14) ,4=V(1一w+W P山.)+ (1一w+W‘Pa42)+ (1一w+W‘p^3)+z(1一w+W’p ) I=v・I +X。I2+Y・13+z。I 4 在公式(14)中,Il表示群体中信任等级为1的博弈方的期望收益 表示信任等级为2的博弈方的期望收 益,,3表示信任等级为3的博弈方的期望收益,,4表示信任等级为4的博弈方的期望收益, 表示群体的平均期望 收益.公式(13)即为差异化服务下网构软件的Wright-Fisher多策略信任演化模型. 5 Wright.Fisher多策略信任演化模型激励机制研究 对于网构软件中4个信任策略收益矩阵的确定,本文在差异化服务和演化稳定策略(evolutionary stable strategy,简称ESS)的基础上引入了基于博弈的激励机制.演化稳定策略是指个体行动者获得的是关于信任的不 完全信息.所以只能采取“试探、学习、适应、成长”的行为逻辑,在不断重复博弈过程中,仅具有有限信息的信 任实体根据信任的收益在边际上对其策略进行调整以追求自身利益的改善,不断地用“较满足的事态代替较不 满足的事态”,最终达到一种可信的动态平衡.在这种平衡状态中,处于网络节点的个体不再愿意单方面改变其 策略,则这种平衡状态下的策略为演化稳定策略L2 . 在网构软件中,当非信任个体与信任个体进行博弈时,前者通过损害后者的利益而使自己获得利益,其行为 违背了公平规范.因此,如果博弈个体受到公平规范的影响,那么非信任个体的效用收益就会因为破坏公平造成 的“内疚”而降低:而信任个体的效用收益则会因为非信任个体违反公平造成额外的“不满”而增加.修改表2中 的收益矩阵可以得到表3. 由表3可以看出,当两个实体进行博弈时,对于信任等级高的实体,系统根据公平规范原则对其进行收益增 1986 Journal of Software软件学报Vo1.23,No.8,August 2012 加的奖励,其中, 为激励惩罚参数.观察收益矩阵可以看出,由于该收益矩阵为对称矩阵,故激励惩罚参数也是对 称的. Table 3 Payoff matrix of four strategies with incentive mechanism 表3加入激励机制后的四策略收益矩阵 通过该激励机制对信任模型进行激励惩罚后,系统将该结果反馈到差异化服务的收益函数计算模型上,从 而使得系统执行对实体信任行为的激励惩罚策略,对不同的实体进行有差异的服务.其中,信任等级高的实体将 获得更好的收益,而信任等级低的实体将获得相应的惩罚.则系统将向着信任等级高的方向进行演化,从而该激 励机制起到了提高系统整体信任度的作用,为系统提供了一个激励优化的策略机制. 6模拟实验与结果分析 根据以上的分析,本文对该信任演化模型进行模拟实验.通过仿真来模拟开放网络环境下网构软件实体信 任演化的过程,从而验证该模型的有效性. 本文的硬件实验环境为Intel Core(TM)Duo 2.66GHz CPU,2GB内存,采用Windows XP操作系统,用 Matlab6.5编程进行仿真实验.首先模拟开放网络的网络环境,将开放网络中网构软件实体的信任划分为4个等 级.假设4个信任等级的软件实体的贡献量分别为d1=2, =1.8,,/3=1.6,a4=1.4;不同信任等级的影响因子分别为 (两个实体的信任等级之差与其影响因子成正比)6ll=0,bl2=0.6,b13=0.8,bt4=0.9,b2l=0.6,b22=0,b23=0.6,b24:0.8, 631=0.8,b32=0.6,b33=0,b34=0.6,b41=O.9,b42=0.8,b43=0.6,b44=0.软件实体的信任度分别为口l:4,a2=3,0:3=2,a4=1.根据 公式(2),系统选择接受不同信任等级软件实体的请求的概率分别为 p(d1):0.909,p( ) 0.778,p(d3)=0.596,p(d4)=0.412, 则由公式(3)计算可得4个信任等级软件实体的全局收益值分别为 “1=1.291,“2=0.752,/23=0.498,u4=0.330. 通过该全局收益值可以得到不同信任策略博弈的收益矩阵,即采用不同信任策略的实体之间相互博弈后 的各自收益.计算所获得的收益值见表4. Table 4 Payoff values of four strategies 表4四策略收益值表 信任策略 1 2 参与者 3 4 1 4.437,4.437 3.359,4.706 4.833,2.85I 2.851,4.833 2.515,4.917 2.911,3.331 参与者 2 3 4.706,3.359 3.628,3.628 3.120,3.755 2.784,3.839 3.755,3.120 3.247,3.247 4 4.917,2.515 3.839,2.784 3.331,2.911 2.995,2.995 将表4中的数据代入到公式(13)、公式(14)中,根据计算结果对该网构软件的信任演化进行模拟实验,则网 构软件系统信任的演化趋势如图2所示.假设此时选择因子w=0.9,4个信任等级的初始比例分别为v(0)=0.2, (0)=0.2 (0):0.3,z(0)=O.3. 由演化结果可以看出,在整个网构软件的信任演化过程中,非信任的演化最终占据主导地位.这是由于此时 印桂生等:网构软件的Wright—Fisher多策略信任演化模型 1987 非信任的总收益要大于信任的总收益,自私行为主导了整个网构软件信任演化方向,即产生了free—riding问题. 这使得“非信任合作”策略成为某些网构软件实体的首选策略,导致网络的效用降低,产生了实体收益与系统整 体收益冲突的问题.在真实的开放网络环境中,如果系统对软件实体没有实施任何手段,那么软件实体会最 大化自身的利益,从而导致了整个网络可信度的降低.因此,图2所示的模拟结果真实而准确地反映出了在无调 控规则的网络环境下软件实体的信任情况.由此可知,要使得信任策略成为主导策略,就要对软件实体的信任合 作行为进行适当的激励.根据本文提出的激励机制,通过激励惩罚参数 对实体的收益矩阵进行调整.首先假设 (两个实体的信任等级之差与其激励惩罚参数成正比,即两实体信任等级差异越大,其激励惩罚力度越大): ktx=0.05, =0.06,肋:0.07,P4=0.05, :0.06, =0.05, 则此时的四策略收益值见表5. 1・O 3 25 一 0・8 Ⅱ / 3 15 \ 丑 上ⅡO.6 — }_ 告 牛 奄! .1  言任等级:23 05 \ \ 0.4 } f言任等级.j一 95 } 2,— 出 、 j一 言任等级:4 t 、\ O.2 牛\ 2.85 、 ’、 \ ~ 0 、 l二 士~ 2.75 0 50 1o0 150 200 250 300 O 50 100 l50 200 250 300 演化代数:f 演化代数:f (a)信任比例的对比 (b1系统信任的平均收益 Fig.2 The initial trend chart of trust evolution 图2初始信任演化趋势图 Table 5 Payoff values of four strategies after encouraging 表5激励后的四策略收益值表 信任策略 参与者 1 2 3 4 l 4.437,4.437 3.762,4.303 3.312,4.372 3.035,4.397 参与者 2 4.303,3.762 3.628,3.628 3.464,3.411 3.181,3.442 3 4.372,3.312 3.411,4.464 3.247,3.247 3.223,3.019 4 4.397,3.035 3.442,3.181 3.019,3.223 2.995,2.995 将表5中的数据代入到公式(13)、公式(14)中,根据计算结果对网构软件实体的信任演化进行模拟实验,则 网构软件系统信任的演化趋势如图3所示,此时,4个信任等级的初始比例分别为 v(0)=0.2, (0)=0.2, (0)=0.3,z(0)=O.3. 由图3可以看出,当对软件实体的信任行为收益进行激励机制调整后,网构软件整体趋向高信任的方向进 行演化,此时,统信任的总收益达到预期的较高水平,呈现出高信任的自组织演化的现象.通过惩罚实体的自私 行为,使得“信任合作”策略成为网构软件实体的首选策略,促使网络的整体效用升高.由图3还可以看出,增加激 励惩罚参数后,系统的信任演化具有更高的稳定性,没有出现较大的波动,因此,信任演化模型在动态变化的环 境中具有较高的稳定性. 下面通过改变激励惩罚参数来分析该参数对软件实体信任演化的影响.假设: ktl=0.06, =0.07,/13=0.1,/-t4=0.06, =0.07,/16=0.06, 则此时的四策略收益值见表6. 将表6中的数据代入到公式(13)、公式(14)中,根据计算结果对网构软件实体的信任演化进行模拟实验,网 l988 0 丑 O 《神 O 0 Journal ofSoftware软件学报Vo1.23,No.8,August 2012 器基 ● O 0 壬J O O O 8 6 4 2 O 8 6 4 2 构软件系统信任的演化趋势如图4所示.此时,4个信任等级的初始比例分别为 v(0)=0.2, (0)=0.2, (0)=0.3,z(O)=0I3. 4.2 一 4.o / / —号_信任等级:1 +信任等级:2 十一信任等级:3 B一信任等级:4 一—3.8 3.6 , _/ j f ? 3.4 O / 3.2 o 50 1OO 150 200 250 300 0 50 l00 150 200 250 300 演化代数:f (a)信任比例的对比 演化代数:f (b)系统信任的平均收益 Fig.3 The trend chart of trust evolution in case of Pt=0.05, =0.06,肋=0.07,/14=0.05,ps=0.06, =0.05 图3激励惩罚参数 l=O.05,//2=0.06,]/3=0.07, =0.05,lfs=0.06,g6=0.05时的信任演化趋势图 Table 6 Payoff values of four strategies after adjusting incentive penalty parameters 表6调整激励惩罚参数后的四策略收益值表 信任策略 1 2 参与者B 3 4 1 4.437,4.437 3.843,4.222 3.389,4.295 3.258,4.174 参与者 2 3 4 4.222,3.843 4.295,3.389 4.174,3.258 3.628,3.628 3.343,3.533 3.375,3.248 4.2 3.533,3.343 3.247,3.247 2.956,3.286 3.248,3.375 3.286,2.956 2.995,2.995 b— √ 厂 一 一 / 4.0 / | / , — 9__ 盲任等级:1一 / { —盲任等级:2 唐任等级:3 日一信任 级:4 3.8 3.6 , l / | { 50 1OO 150 200 250 300 { 3.4 善 0 50 1OO 150 200 250 300 f 3.2 0 演化代数:f (a)信任比例的对比 演化代数:f (b)系统信任的平均收益 Fig.4 The trend chart of trust evolution in case of//1=0.06, =0.07,/.t3=0.1, =0.06,/as=0.07, =0.06 图4激励惩罚参数/.t1:O.06,/a2=O.07,,//3 ̄0.1,g4=O.06,/.ts=O.07,g6=O.06时的信任演化趋势图 通过对比图3和图4可以看出,适当地增加激励惩罚力度,可以使网构软件系统更快地演化到稳定状态.图 3显示出,当网构软件系统演化到300代左右时逐渐达到稳定状态;图4显示出,当网构软件系统演化到150代 左右时达到稳定状态.因此,适当地增加激励惩罚力度可以有效地调节网构软件系统的演化速度,从而提高网络 整体的效率.图5为以上3种情况下自私节点所占比例的对比图,图6为不同策略下网构软件系统平均收益变 化趋势的对比图.由图5和图6可以看出,通过本文提出的激励惩罚机制,可以有效地抑制自私节点的增加,提高 网构软件系统的平均收益;并且通过调节激励惩罚的力度可以促使网构软件系统的信任达到最优状态,从而提 ● 0 8 O 6 印桂生等:网构软件的Wright.Fisher多策略信任演化模型 1989 0 高网构软件系统整体的可信度 1 0 —0.8 上Ⅱ0 6 扭皿0.4 f 7 — 一无激励 一肺睾一激励惩罚力度1 f } 02 .一激励惩罚力度2 无激励 激励惩罚力度1 +激励惩罚力度2 ・O 0 : =盘 0 50 100 15O 200 250 300 0 50 lOO l50 200 250 300 演化代数:f Fig.5 Comparison chan of changing trend for 演化代数:f Fig.6 Comparison chaH of changing trend for selish fnodes under different strategies average payoff under different strategies 2 2 6 l 0 O 8 O 6 图5不同策略下自私节点变化趋势对比图 2 O 8 6 4 2 O 8 4 4 3 3 3 3 3 图6不同策略下平均收益变化趋势对比图 由于开放网络环境具有复杂性、多态性以及演化性的特点.所以软件实体的信任演化存在着~一定的风险. 在环境突然改变的情况下,本文对该信任演化模型进行适应性测试,实验结果如图7所示.当系统演化到l2O代 左右时,网络中软件实体的信任比例发生变化.由图7可知,在环境突然改变的情况下,该模型仍然能够准确地对 系统的信任演化趋势进行模拟,对信任的演化趋势没有造成影响.因此,该信任演化模型具有较好的适应性和抵 御风险的能力,能够适应开放网络环境的复杂性、多态性以及演化性的特点. 多策略的信任演化与典型的两策略信任演化相比,增加了对开放性网络中实体信任行为的复杂性特点的 研究,更加符合开放性网络中实体信任行为演化的特点.图8为两策略实体信任演化趋势图.由图8可以看出,当 两策略的信任演化进行到10代左右就进入了稳定状态.而在复杂的网络环境中,这样单纯的演化趋势是不存在 的,因此,本文提出的多策略的信任演化更加符合开放网络中实体行为复杂性的特点. —一一 曲一 皇 白 / 口 jE信 } 丑 上Ⅱ 神 迎里 0 ≤: /产 _一…—。e _一蓓信…茬任 葶等… 级:~z34I 。,’ 出 迎 l00 200 300 400 丑 上Ⅱ } / \ j一 4 8 l2 16 2O 0 演化代数:f Fig.7 Adaptability test for model 演化代数:f Fig.8 Trend chaa of trust evolution for two strategies 图7模型适应性测试 图8两策略信任演化趋势图 7结束语 本文针对以往信任演化模型的典型不足,借助差异化服务思想、Wright—Fisher模型和多策略博弈理论,提出 了一种差异化服务下网构软件的Wright—Fisher多策略信任演化模型.基于差异化服务理论来确定网构软件实 体信任行为的全局收益函数,通过将网络环境中的属性进行量化,并将博弈引入到差异化服务中,以确定不同信 任等级实体的全局收益函数:由于网构软件系统具有种群演化的特点,所以将Wright.Fisher模型引入信任演化 1990 Journal of Software软件学报Vo1.23,No.8,August 2012 模型的建立中更符合种群进化的特点;信任收益的多策略博弈是在两策略博弈基础上进行的复杂多策略博弈, 使其符合复杂开放网络中系统演化的复杂性特点;并且在信任模型的基础上引入了基于博弈的激励机制,通过 制定公平规范来调整实体信任的收益,使信任实体比非信任实体获得更大的效用,从而制约了自私节点非信任 合作的倾向,激励实体趋向信任合作,使网构软件系统更快地收敛到信任的稳定状态.该模型具有较好的适应性 和准确性,有效地提高了网络的使用效率,使网构软件系统的信任收益达到最优,提高了系统的整体可信度. 在该领域的研究上,我们还要进一步研究如何对网构软件实体的信任证据进行收集、信任等级进行划分以 及提取网络中与信任相关的属性;并且对信任收益的多策略博弈机制进行更深一步的研究,建立更加有效的激 励惩罚机制来激励系统信任收益的最大化,从而进一步提高系统的可信度. References: [1】Yang FQ.Thinking on the development of software engineer.Journal of Software,2005,16(1):1—7(in Chinese with English abstract).http:#wwwdos.org cn/l000—9825/16/1.htm[doi:1O.13600osl60001e] i J,Xu F,Zhang L.A trust measurement and evolution model for internetware.Journal of Software,2006,17(4): [2] Wang Y,Li682—690(in Chinese with English abstract).http://www.jos.org.cn/1000—9825/17/682.htm[doi:10.1360/jos170682] [3] J ̄sang A The right type oftusrt or fdistributed systems In:Proc.ofthe New Secutity Paradigms Workshop.1996.1 19-131.[doi: 10.1145/304851.304877] 【4】 Li W,Tian SF,Huang HK.Evolutionary games theory and agent self-organizing dynamics.Journal of Computer Research and Development,2006,43(z1):47—50(in Chinese with English abstract). [5] Li XY,Gui XL.Cognitive model ofdynamic tustr forecasting.Journal of Software,2010,2l(1):163—176(in Chinese with English abstract).http://www.jos.org.cn/lO00—9825/3558.htm[doi:10.3724/SP.J.1001.2010.03558] han K,Ripeanu M,Satin A,Foster I.To share or not to share:An analysis of incentives to contribute in collaborative file [6] Ranagnatsharing environments.In:Proc.ofthe 1 st Int’l Workshop on Economics ofPeer to Peer Systems.20031-6. .anc A,Liu YK,Vahdat A.Designing incentives for peer—to-peer routing.In:Proc.of the 24th Annual Joint Conf.of the IEEE [7] BlComputer and Communications Societies(INFOCOM 2005).Miami:Institute of Electrical and Electronics Engineers Inc.,2005. 374—385.[doi:10.1 109/INFCOM.2005.1497907】 ncentives in BitTorrent induce free riding.In:Proc.of the ACM SIGCOMM Workshop on Economics of [8] Jun S,Ahamad M.IPeer-to—Peer Systems(P2P3CON).Philadelphia:Association for Computing Machinery,2005.1 16—12I.[doi:10.I 145/1080192. 1080199] kar A,Song YS.Multi-Locus match probability in a finite population:A fundamental difference between the Moran and [9] BhasWright—Fisher models.Bioinformatics,2009,25(12):187—195l【doi:10.1093/bioinformatics/btp227] LA,Nowak MA.Evolutionary game dynamics in a Wright-Fisher process.Journal of Mathematical Biology,2006,52(5): [10] Imhof 667—681-【doi:10.1007/s00285-005—0369—8] Yang B,Molina HG.Micropayments for peer-to—peer systems.In:Proc.of 10th ACM Conf.on Computer and Communications Security.Washington:ACM Press,2003.300—310.【doi:http://dx.doi.org/10.1 145/948109.948150] [12] Wang P,Sun CS,Li LJ.Primary research on internetware reliability technology.In:Proc.of the 1 st Int’1 Multi—Symp on Computer and Computational Sciences(IMSCCS 2006).Hangzhou:Institute of Electrical and Electronics Engineers Computer Society,2006.424-428.【doi:10.1 109/IMSCCS.2006.253] [13] Tuyls K,Hoen PJ.An evolutionary dynamical analysis of multi-agent learning in iterated gamesAutonomous Agents and Multi. .Agent Systems,2006,12(1):1 15-153.[doi:10.1007/s10458-005—3783-9】 i J.Reputation—Based recommender discovery approach for service selection.Journal of Software,201021(21:[14] Pan J,Xu F,Li ,388—400(in Chinese with English abstract) httpY/www.jos.org.crdl000-9825/3791.htm[doi:1O.3724/SP.J.1001.2010.03791] YF,Liu XS.XLimit dynamics of one kind of stochastic evolutionary games in inifte populations[15] Ma Journal of Nanjing University .Mathematical Biquarterly,2009,26(1):108-1 10(in Chinese with English abstract). T,Sarin R.Learning through reinforcement and replicator dynamics.Journal ofEconomic Theory1997,[16] Bergers 77(1):1-14.fdoi: ,10.10060eth.1997.2319] [17]Taylor PD,Jonker LB.Evolutionarily stable strategies and game dynamics.Mathematical Biosciences,1978.40(1.2):145—156.[doi 10.1016/0025—5564(78)90077—9】 印桂生等:网构软件的Wright-Fisher多策略信任演化模型 1991 [18] Chong SY,Yao X.Behavioral diversity,choices and noise in the iterated prisoner’s dilemma.IEEE Trans.on Evolutionary,2005, 9(6):540—551-【doi:10.1 109/TEVC.2005.856200] [19] Chong SY,Yao X.Multiple choices and reputation in multiagant interactions.IEEE Trnas.on Evolutionary Computation,2007, 1 1(6):689-一-71 1-【doi:10.1 109/TEVC.2006.890544] [2ff] de Ara6jo RM,Lamb LC.Neural-Evolutionary learning in a bounded rationality scenario.In:Proc.of the Int’1 Confi on Neural Information Processing.,Vo1.11.2004.996-一1001.[Fdoi:10.1.1.86.5385] [21] Liu WB,Wang XJ.Study on evolutionary games based on PSO--neural networks.Systems Engineering and Electronics,2007:,29(8) 1282—1284 On Chinese with English abstract).[:doi:CNKI:SUN:XTYD.O.200%-08—015】 【2T】 Ma RTB,Lee SCM,Lui JCS,Yau DKY.Incentive and service differentiation in P2P networks:A game theoretic approach. IEEE/ACM Trans.on Networking,2006,14(5):978-一991_【doi:10.I 109/TNET.2006.882904] [23] Xie SY.Evolutionary game theory under bounded rationality.Journal of Shanghai University of Finance and Economics,200 1,3(5) 3-9(in Chinese with English abstract). [24]] Darwen PJ,Yao X.Co-.Evolution in iterated prisoner'’S dilemma with intermediate levels of cooperation:Application to missile defense.Int’1 Journal ofComputational Intelligence and Applications,.2002.,2(1):83-一107.【doi:10.1 142/S1469026802000440】 [25] Wu HX.,Dong HY,Zhang Q.Evolutionary game analysis of information-.sharing mechanism in network organization.Computer Engineering and Applications,2009,45(16):232—234(in Chinese with English abstrac0.【doi:10.3778/j.issn.1002—8331.2009.16. 067] 附中文参考文献: [1]杨芙清.软件工程技术发展思索.软件学报,2005,160):1-7.http://www.jos.org.cn/1000-.9825/16/1.htm【Aoi:10.1360/j0s16O001e] 【2]王远,吕建,徐锋,.一个适用于网构软件的信任度量及演化模型.软件学报,2006,17(4).'682-一-690.http://www.jos.org.cn/1000- 9825/17/682.htm【doi:10.1360/josl70682] [4]李万,田盛丰,黄厚宽.进化博弈论及Agent自组织动力学.计算机研究与发展,2006,43(z1):47-50. [5】李小勇,桂小林.动态信任预测的认知模型.软件学报,2010,21(1):163—176.http://www.jos.org.cn/1000-9825/3558.htm[Aoi: 10.3724/SP.J.1001,2010.03558] [14】潘静,徐锋,吕建.面向可信服务选取的基于声誉的推荐者发现方法.软件学报,2010,21(2):388—400.htttp://www.jos.org.cn/1000- 9825/3791.htm Idol:1O2724/SP-J.1001.201O.03791】 【15】马燕芳,刘心声.一类总体有限的随机进化博弈的极限动态-南京大学学报(数学半年刊).,2009,26(I):108—110. [21]刘伟兵,王先甲.基于PSO神经网络的进化博弈研究.系统工程与电子技术,2007,29(8):1282-1284.[doi:CNKI:SUN:XTYD.0. 2007-08--0 1 5] [23]谢识予.有限理性条件下的进化博弈理论.上海财经大学学报,2001,3(5):3—9. [25]吴慧欣,董海祥,张强.网络组织信息共享的演化博弈研究.计算机工程与应用,2009,45(16):232-一234.[Moi:10.3778/j.issn.1002,- 833 1.2009.1 6.0671 印桂el:(1964一),男,江苏泰兴人,博士,教 董宇flJ((1974一),女,博士,副教授,CCF会 授,博士生导师,CCF高级会员,主要研究 员,主要研究领域为可信软件,数据与知识 领域为可信软件,数据与知识工程,虚拟现 工程,智能信息处理. 实,信息安全. 王莹洁(1986一),女,博士生,CCF学生会 崔晓11 ̄(1984一),男,博士生,CCF学生会 员,主要研究领域为可信演化,可信度量, 员,主要研究领域为服务发现,服务计算. 网构软件. 网构软件. 

因篇幅问题不能全部显示,请点此查看更多更全内容

Copyright © 2019- huatuo0.cn 版权所有 湘ICP备2023017654号-2

违法及侵权请联系:TEL:199 18 7713 E-MAIL:2724546146@qq.com

本站由北京市万商天勤律师事务所王兴未律师提供法律服务