第33卷第4期 北京信息科技大学学报 Journal of Beijing Information Science&Technology University Vo1_33 No.4 Aug.2018 2018年8月 文章编号:1674—6864(2018)04—0047—07 DOI:10.16508/j.cnki.11—5866/n.2018.04.008 部分线性回归模型的主成分Liu估计 魏文科,王 昕 (北京信息科技大学理学院,北京100192) 摘 要:针对参数回归模型受很多函数假设和非参数回归模型受“维数灾难”影响 问题,构造出半参数线性回归模型。结合半参数线性回归模型的主成分估计和Liu估计方法,提 出了半参数线性回归模型的主成分Liu估计方法,分别推导出在无约束条件下、精确约束条件下 和随机约束条件下的回归系数的各个数字特征,为进一步深入研究半参数线性回归模型的主成分 Liu估计提供了有效的理论基础。 关键词:半参数线性回归;主成分Liu估计;约束条件 文献标志码:A 中图分类号:O 212.1 Principal component Liu estimation of the parameters in partially linear regression models WEI Wenke,WANG Xin (School of Applied Science,Beijing Information Science&Technology University,Beijing 100192,China) Abstract:Because the parameter regression model is limited by many function hypotheses and non— parametric regression model is affected by dimensionality disaster,a semiparametric linear regression model is constructed in this paper.By combining of principal component estimation method and Liu estimation method.a new meth0d—the principal component Liu regression estimation method in partially linear regression models,is proposed.Under unconstrained conditions,exact constraints and random constraints,each digital feature of regression coeficifent is derived respectively.These properties provides an effective theoretical basis to the study of the principal component Liu estimation of the semi parametric linear regression mode1. Keywords: semiparametric linear regression;principal COnstraint condition component Liu estimation; 0 引言 近几十年来,线性模型中参数估计问题的研究 在“维数灾难”的问题,非参数估计不能精确地估计 参数,于是非参数回归模型又进一步发展到了半参 数回归模型。 同时,关于有偏估计的很多理论是基于线性回 在广度和深度上都得到了很大的发展。但在实际应 用中,线性回归模型需要对函数做出很多假设,用它 归模型上进行研究的,但是在实际的问题中,因变量 和自变量之间不是简单的线性关系,可能会随着自 变量维数的增加而出现多重共线性的问题。为了克 去处理不符合假设的问题时会引起很大的偏差甚至 会得到错误的结论。为了能接近现实并更好地解释 数据,参数回归模型已发展到对回归函数很少 的非参数回归模型。非参数回归模型更加稳健,预 服这些问题,半参数回归模型有偏估计受到学者们 的重视。它在一定程度上既保持了非参数回归模型 的灵活性,又可以很好地克服由于自变量维数增加 测的精确性也有很大的提高。但是对于在多元中存 收稿日期:2018-02-24 基金项目:国家自然科学基金资助项目(71501016);北京信息科技大学“勤信人才”培育计划(QXTCP B201705) 作者简介:魏文科,男,硕士研究生;通讯作者:王听,女,博士,副教授。 48 北京信息科技大学学报 第33卷 而出现的问题。对于有偏估计的研究,Massy 提出 主成分估计,设计出一种新的估计方法,剔除存在多 重共线性的因子,用来消除原有最小二乘估计因子 线性问题的影响。Horel等 通过对设计矩阵 添加一个参数 得到了岭估计。另外,许多学者也 发现了在一定条件下结合2种估计得到新的有偏估 计优于其中任何单一的估计,Baye和Parker提出了 线性回归模型的主成分岭估计。Liu为了克服线性 模型中出现的多重共线性问题而提出的一种有偏估 计一Liu估计 。本文结合半参数回归模型的主成分 估计和Liu估计的优点,提出半参数回归模型的主 成分Liu估计,得到其估计性质。 1 主成分Liu估计的构造及性质 半参数回归模型¨五 在预测经济领域被广泛 应用。Engle等在研究气温与用电量之间的关系时 提出了半参数模型: Y = 十 t )+ =1,2,…,n (1) 式中: 为因变量观测值; =( ¨ …, )。。’为 已知的p(p≤n)维向量,且x 是自变量的观测值; t 为一个可以观测的单变量。一般地,假定t 为一 维变量,如t 为一组观察时间量,卢=(/3 ,/3:,…, 卢 ) 为P维待估的未知参数向量,f(·)也是未知的 光滑的函数,式(1)可转换为 Y=xfl+,+s (2) 式中:Y=(Y1,Y2,…,Y ) ; =( l, 2,…, ) ; f=(_厂(t ) t ),… t )) ;随机误差s=( , 2,…, )T o 对于模型式(1),假设其中的卢是已知的,可令 Y =Y — 模型式(1)可改写为 Y =Y。一 :f(t )+ i=1,2,…,n (3) 基于局部多项式拟合给出半参数回归模型非参 数部分的估计,对于未知光滑函数f(·),在给定的 t0下,进行Taylor展开: -厂(t) t0)+_厂(t。)(t—to) (4) 令K (t)=K(t/h)/h为给定的核函数,则半参数回 归模型的局部线性拟合可以选择一个合适的 { t。) (t。)},当 {l厂(t。) (t。)} = {D 。D D ̄oW,。(y一邓) 使 ∑[y 一_厂(to)-f(to)(t 一t。)1 2K (£ 一t。) =l (5) 的值达到最小。 其中: =。diag{Kh(tl—to),K^(t2一to),…, Kh(t 一to)} Yl Y= Y2 ,X= = ,D : ● 。● : y 写为将式(3)中的 i)用l厂( 。)代替,式(2)可改 『( 0) wf-Dt }一ID…T W ] s=I‘.1。.) 2 :2 l (1 0){DT wJ D }。。D wf 注意模型式(6),它不同于普通的Y= +£ 型模型,因为其中的云与f,t, ,S有关。 下面在Profile最小二乘方法的基础上构造 的 Liu估计 J。基于线性模型式(6),增加一个罚函数 I l一 l l构造如下的目标函数: ( )=argmin{(Y— ) (Y— )+ ( 一 ) ( 一 )} 由 =0整理删 ( +J) =(X Y+d PLs) (7) 对式(7)求解可得p的Profile最小二乘Liu估 计为 (d)=(X一 X一+J)一 (X一 ’Y+d )= ^ 一一 一一 (X X+J) (X X+d1)lfPLs 0<d<1 其中d为可协调的参数。 第4期 魏文科等:部分线性回归模型的主成分Liu估计 49 由最小二乘估计和Liu估计的定义易得 的最 小二乘估计和Liu估计分别为 卢 =( 璐 定义1在半参数回归模型y= 卢主成分Liu估计为 (r,d)= (/I +,) (/l。+d,) +s中,取 ) X一 Y一= (11) (d)=( +,)一 ( + ) 凡 称 。(/I +,) (/l +以) 下面再介绍半参数模型的主成分估计,首先对 模型式(6)做以下变形: (r,d)为半参数回归模型的主成分Liu估 计。由此来分析主成分Lju估计的性质。 y= +云= +否=z + (8) =( l, ,…, )是一个P xp的正交矩阵, 再记: Z= =( 1, ,…, ), = 卢 设A1≥A ≥…≥A 是 的特征根, 为 的第i个特征根A 对应的特征向量。 当 之间存在复共线关系时,在主成分作为新 的回归自变量时,可将后面的(P—r)个主成分从 回归模型里剔除。这时候可以记: = 【(0 ) ,, A 2 J = =国= 那么对于模型式(8),可以写成如下形式: Y= p+ = 鲫 + = Za+ =Z1 1+Z2 + (9) 剔除后面(P—r)个对自变量影响较小的主成分 得到: y=Z1 + (10) 已知 = ,参数卢估计改写为 ㈩ 。al z = /l 这是 的主成分估计 , 。则半参数回归模型的 Liu估计和主成分估计分别为: Ls (d)=(X +J) ( +d1) 凡s (r)= 。Ai l, 由此在半参数主成分估计、Liu估计和最小二 乘法估计的启发下,构造一个新的估计——主成分 Liu估计。 定理1 cov[卢PLsL(r,d)]= 。 1( l+,)I1(/l1+d1)/l · (J— )(J— ) A · ( +d,)(/l +j) 证明 由偏差和协方差的定义可知 Bias[ ̄ (r,d)]= [ (r,d)]一 = E[ ( +,) (/l。+ )/I ]一卢= E[ ( 。+J)一 ( + ) 科 · (j— )( +,+s)]一 :E[ (A。+J)~· ( 。+al,) 科 ]+E[ 。(/l + )~· (/l +以)/l 。 (J—S)yl+0一 = [ 。(/l1+J) ( + ) —1] + 。· (/l +,) (/l + ̄I)al (J—S)f (12) coy E ̄PLsL(r,d)]= cov[ (/l +J) (/I + ̄i)ai ]= COV[ ( 。+,)一 ( 。+ ) 科 · (,一S)( +,+£)] (13) 由参数部分可知 cov(y)=eov(i ̄)= I oov[#P L(r,d)]= [ l(/l1+,)_1( 1+d1)Al X · (I—S)][ (/I +J) (/l +以)· /l (J— )] =0-2 (/l +,)~· ( 。+以) 科 (j—S)(J— ) · 。al (/l1+以)(/l +J)一 (14) 50 北京信息科技大学学报 第33卷 Bias ̄//PLsL(r,d)]= [ ( 1+J) ( +以) 1 一I]lf+ (/I.+J)一 (/l 十 )/l (J—S)f  ̄ov E#PLsL(r,d)]= 。 (/I。+J) (/I.+以) 。 . (J—S) X 1/I (A1+ )( 1+j) 定理证毕。 2精确线性约束下的主成分Liu估计 2.1构造 在回归问题研究中,通常在一定实际背景下进 行回归分析。而这些实际背景通常是一些约束条 件。在半参数模型中加入适当的约束条件可以提高 估计的有效性,下面将研究约束条件下的半参数回 归模型的主成分Liu估计。 考虑如下的精确约束条件 ]: b:A 式中:b为 X l的已知向量;A为 X P的行满秩矩 阵。 结合约束条件和半参数回归模型,构造出精确 约束条件下的半参数回归模型,可得到如下的 模型 ]: y= +£【 A口=b J 用拉格朗日乘子法得到半参数回归模型中主成 分Liu估计中参数部分 的估计: F(p,A)=( 一 ) ( 一 )+ (d 一/3) ( 一 )+2A (3/3一易) (15) 对 ,A求偏导,令其等于零,可得 +2 一 2 PI s+Zp+2A A=0 (16) :2(3/3—6):0 (17) d^ 由式(16)可得 RPLs (d)= (X—T X一+,)一 ( +d卢 Ls—A A)= PLs(d)一( X十,) A A (18) 将式(18)代人式(17),可得 A=[A( +J)一 A ]~(Aft ( )一6) (19) 将式(18)代入到式(16),可得 ( )=卢 一( +,)一 A . [A( X一+J)A ]一(Aft (6f)一6) (20) 又由主成分Liu估计 LsL(r,d)= 。(/l。+,) (/l + )/l = .(/l +J)一(/I + ) 卢 可得半参数回归模型精确约束下的主成分Liu 估计: 卢:Ls (r, )=卢PL (r,d)一( r, +J)一 A一. [A(X X+,) A ]一 (A卢 (r,d)一6) (21) 将 R (r,d)代人约束条件 :b成立。 2.2性质 定理2 设 = 一 (A )~· AW; ,其中 是对称非零矩阵, =X一 X一+kl, 在精确约束条件 =b下, ; (r,d)估计的偏差 和协方差分别为: Bias[卢 (r, )]=E[flpRL。(r,d)]一 = (d一1)Ⅳl W (/I +J) + Ⅳ】w1 】(/I1+,) ( +以)· /l 科 (J—s)f cov[ (,, )]: or [Nl WI l(/l】+J)一 (/II+d1)· /l (,一 )(J—s) /l . (/I + )(/l +,) ’Ⅳ ] 证明首先,求出不带约束条件参数部分 (r, d)的均值: 第4期 魏文科等:部分线性回归模型的主成分Liu估计 51 卢 (r,d)]= E[ 。(/l +,) (/I。+ )/I 科 Y]= E[ l( 1+J) ( 1+口l,) · (J—S)( +,+s)]= l(A1+J)一 · (/I +以) + (J—s)f= +(d一1)I 1(A1+I) 卢+ 科 (J—S)f (22) 设b0=A (AA )~b,显然有Abo=b,于是精 确约束条件下半参数回归参数部分主成分Liu估计 又可表示为 RLs r,d)= LsL r,d)一( +,)一 A · [A( +J)-1A ]-1[A PLs (r,d)一6]= W Wl PLsL(r,d)一 A (AA )~· AW[ W1 PLsL(r,d)+ A (AA )~b= ⅣlWI PLsL(r,d)+W A (AA )~b= Ⅳ W PLsL(r,d)+W A (AA )~· w Wlbo—w W1bo+bo=N1W1卢P L(r,d)一 Ⅳ1W1西0+西0=N1W1( P L(r,d)一60)+bo (23) 从而可得到,在精确约束条件 =b下, 卢 R (r,d)的估计均值为 E( ̄pRL (r,d))= E[Ⅳ。w ( PLsL(r,d)一bo)+b。]= Ⅳ [E(flPLsL(r,d)一b。)]+b。= N1 W1 +(d一1)N1 Wl l(/l1+ )-1 + Ⅳ (/I +J) (/l1+ )/I · (J—S)f一Ⅳ1 Wlbo+bo=Nl W1( 一bo)+ (d一1)N W1 1(A1+J)~· +Ⅳ1 wl 1( 1+,)~· ( 。+ ) 科 (J—s)f+b。 (24) 由 =b,Ab0=b,得 Ⅳ W ( 一b。)= 一bo 又有b。=A (AA )~b,显然满足Ab。=b 由上述,最终可得 E E# ̄L (r,d)]= (d一 )Ⅳ W1 + + (25) Ⅳ1 W1 1( l+J)。。(/I1+ )· /l (,一S)f 其偏差为 Bias[ (r,d)]=E[ (r,d)]一 = (d一1)Ⅳ1 W1 ( 1+J) + Ⅳ1 W1 1( +J)I1( + )· /l (J—S)f 其协方差为 cov[# ̄RsL(r,d)]: COV[N1Wl( PLsL(r,d)一b0)+bo]= COV[N1W1卢PLSL(r,d)]= cov[N1 Wl (A +J) ( +以) 科 Y]= cov[N WI 。( +J)一 (/l +以)/l · (J—S)( +,+ )]=N1 Wl 1(A1+J)一 · (/l +d1)/l (,一 )cov(y)· [Ⅳ w 。( +J)一 ( +d1) · (J— )] = [N W (A +J)~· ( +d/) 科 ( — )(J— ) · 。 (/I +以)(/l +J) 科 Ⅳ ] 定理证毕。 3 随机约束条件下的主成分Liu估计 3.1构造 考虑如下的随机约束条件 : b= +叩 式中:b为一个k×1的已知向量;A为一已知的k× P行满秩矩阵; 为均值为0,协方差为or 的随机 向量,其中 为一个已知的正定矩阵。 结合随机约束条件和半参数回归模型,构造出 随机约束条件下的半参数回归模型: 52 北京信息科技大学学报 第33卷 十 (26) 采用拉格朗日乘子法,求解满足随机约束条件 下的参数部分的Liu估计。 F( ,A)=(Y一 )T(Y一 )十 (d 一13) ( 一 )+ (27) 2A(A卢一b) ( 一b) 对F(卢,A)中的/3,A各求偏导,其中入是k×1的矩 阵,将其整理并令偏导等于零,则有 旦 :一2 +2 一2 d占 + 一2A A 。。(b—A卢)=0 (28) :OA 2( 一 :0 (29) 解上面的方程,可得 的随机约束条件下Liu 估计为 R C (d)= ( )一( X一+J)一 A · [ +A( +j)一·A ]一 (A I (d)一b) (30) 将式(30)代人随机约束条件中,即有 b=A PLRCsI (d)+叼 由无约束主成分Liu型估计 (r,d)= 1(/l1+,) (/Il+d1) 1 y 进而得到随机约束条件下半参数回归模型中B 的主成分Liu估计为 RC PLsL(r,d)= PLsL(r,d)一( 十,)I1A · [ +A( +J) A ] (A (r,d)一b) (31) 将 R C (r,d)代人随机约束条件中,有 b=A卢PRLCs L (r,d)+叼。 3.2性质 对于半参数回归模型的随机约束主成分Liu 估计 R C (r,d)= r, )一( X一+J)一 A · [ +A( +J) A ] (A (r,d)一b) (32) 设:N = 一 A (AWl A )AW; , = +kl 定理3 Bias[flPRLCsL(r,d)]=E[ ̄RLC1 (r, )]一 =ti一( +J)一 A [ + A(X一 X一十J)一 A}.Bias[fl…(r,d)] (33) cov E ̄p L(r,d)]={J一(X X+J) A · [ +A (X X+,) A]I1A}· eov Efl(r,(z)]{J一(X一 X一+,)一 A · [-f2+A (X一 X一+I)一 A]一 A (34) 证明 Bl ̄a PlRC_sL(r,d)]=E[卢PRLCsL(r, )]一 = {卢PIsL(r,d)一(X X+J) A一· [. +A(XT X+J) A ]~(Aft 。JsI 一d)}一卢= E Efl (r,d)]一E{(X X+J) · [ +A( X+,) A ]~(Aft 一r2)}一 = E El3 (r,d)]一E{( +J)一 A一· [ +A(X一 X一+j)一 A ]~(Aft (r, )一 A卢一 )}一 ={,一(X X+J) A · [ +A(X一 X一+J)一 A ]一 A}Bias[卢 (r,d)] (35) 再求协方差: cov[ (r,d)]= E{[卢 (r,d)一E( R C 。 (r,(z))]· [卢 RC (r,d)一 RC ((r,d))] }= E{[J一(X一 X一+,)一 A [n+A( +J)~· A] A_][卢 Ls (r,k)一E(fl Ls (r, ))]· {[J一(X一 X一+ )一 A [ +A( +J)一 · A AI[ (r, )一E(lf (r, ))]} }: [J一( +J)一 A [. +A(X一 X一+J)~· 第4期 魏文科等:部分线性回归模型的主成分Liu估计 53 A]I1A]E{[ Ls (r,k)一E(l 。f (r, )]· [ ( r,|]})一E(lPLfSL r,后)] }[J一 +J)一 A [ +A(X +,)一 A 3一 A] (36) 参考文献: Massy W F.Principal compoents regression in exploratory statistical research[J].Journal of the American Statistical Association,196560 ,再由式(30),则式(36)可改写成 (2):234—256. [2] cov[#PRC L(r,d)]= { 一(X一 X一+,)一 A . Hoerl A E,Kennard R W.Ridge regression: Biased estimation for nono ̄hogonal problems [J].Technomertrics,2000,42(12):55—67. [3] Fikri Akdeniz,Esra Akdeniz Duran.Liu-type estimator in semiparametric regression models. [ +A ( +J)一 A]一 A}· +,)~· Journal of Statistical Computation and coy[#PIJs (r,d)]{I一(X A [ +A ( 定理证毕。 simulation [J]. Journal of Statistical Computation and Simulation,2016,80(8):853 —+ )一 A]一 A} 871. 4 结束语 本文结合半参数线性回归模型的主成分估计和 [4] 朱丹丹,胡宏昌,张捷.半参数回归模型的广 义Liu型估计[J].湖北师范学院学报(自然 科学版),2012,32(1):59—63. Liu估计的方法及其优点,构造出半参数线性回归 模型的主成分Liu估计。利用有偏的估计量对于存 在的多重共线性问题,能更为准确地进行参数估计。 通过推导得到了估计的均值、偏差和协方差,为深入 探讨半参数线性回归模型主成分Liu估计的有效应 用奠定了理论基础。 [5] 黄文焕,戚佳金,黄南天.带线性约束的回归 模型参数的Liu估计方法[J].系统科学与 数学,2009,29(7):937—946. [6] 韦功鼎.Liu型主成分估计的优良性[D].北 京:北京交通大学,2012. [7] 王肖南.半参数可加模型的Liu型估计[D]. 北京:民族大学理学院,2013. (上接第32页) 无源滤波器优化设计研究[J].铁路计算机 应用,2015(10):10—13. 参考文献: [1] 陈小平,于盛林.遗传算法在FIR低通滤波 器设计——频率抽样法中的应用[J].电子 学报,2000(10):118—120. [5] 谭富春,吕幼新,杨皓翔.一种基于遗传算法 的混合滤波器组设计方法[J].现代雷达, 2015(7):26—29. [6] 张筱辰,高宏力,黄海凤,等.基于量子遗传 [2] 孙田雨,史峥.采用改进遗传算法优化FIR 数字滤波器设计[J].计算机工程与应用, 2017(17):108—111. 算法的数学形态滤波器优化设计[J].西南 交通大学学报,2014(3):462—469. [7] 赵俊顶.基于遗传算法的微带超宽带滤波器 建模与设计[D].南京:南京理工大学,2014. [8] 谈敏.基于改进遗传算法的双频段滤波器自 动设计[D].扬州:扬州大学,2013. [3] 陈辉金,黄喜军.基于自适应遗传算法的FIR 低通滤波器优化设计[J].桂林电子科技大 学学报,2015(6):450—453. [4] 周骏萍,金涛,肖旭.基于自适应遗传算法的