最小二乘法的数学研究
最小二乘法的数学研究
1
问题的提出
已知一系列的数据点,为方便数学研究,往往寻找一个近似函数来表达。最容易想到的是采用插值多项式作为近似函数,它要求插值函数通过所有数据点,而对数据点以外的区间没有要求,那么存在以下几个问题:
1)这些数据点本身可能存在一定的测量误差,如果要求近似函数严格通过所有数据点,就会使近似函数保留全部误差,导致近似函数曲线可能存在畸形。
2)随着数据样本的增多,插值多项式的次数也会提高,导致计算过程繁琐耗时,缺乏实用价值。 2
目的
根据已知的数据点,寻找一个简单的近似函数,要求近似函数不必通过所有的数据点,但应与所有数据点的偏差在总体上尽可能的小。 3
最小二乘原理
已知一系列的数据点{(xi,yi)}(i1,2,,在某个函数类Φ{0(x),1(x),,m)
,n(x)}中寻求一个近
似函数,使近似函数与所有数据点偏差的平放和最小,称为最小二乘法(Least Square Estimation)。
设近似函数为
其中0(x),1(x),mp(x)a00(x)a11(x)ann(x)
,an为待定系数。
(1)
,n(x)是一组线性无关的函数组,a0,a1,令S[p(xi)yi]2,则
i1
Sa00(xi)a11(xi)i1mann(xi)yi
2(2)
根据多元函数有极值的必要条件,令
S0,得 akann(xi)yi0 (k0,1,
mS2k(xi)a00(xi)a11(xi)aki1,n) (3)
将上式改写成
ma0k(xi)0(xi)a1k(xi)1(xi)i1i1mmmank(xi)n(xi)k(xi)yi
i1i1mm(4)
记k(xi)l(xi)(k,l),k(xi)yi(k,y),则
i1i1
当k0,1,(k,0)a0(k,1)a1,n时,分别列举上式,得矩阵方程
(k,n)an(k,y)
(5)
作者:王安山 第 1 页
最小二乘法的数学研究
(0,0)(,)10(2,0)(n,0)(0,1)(0,2)(1,1)(1,2)(2,1)(2,2)(n,1)(n,2)(0,n)a0(0,y)a(,y)(1,n)11(2,n)a2(2,y)
an(n,y)(n,n)(6)
上式称为相应的法方程组。 0(x1)1(x1)2(x1)(x)(x)(x)122202令A0(x3)1(x3)2(x3)0(xm)1(xm)2(xm)n(xm)n(x1)a0y1ayn(x2)12n(x3),ηa2,by3,上式可简化为
anym (ATA)ηATb (7)
由于矩阵A的列线性无关,系数行列式|ATA|0,所以方程组存在唯一解。 特别的,当nm时,方阵A可逆,方程两端同时左乘(AT)1,得
此时近似函数通过所有的数据点。 4
最小二乘特例
作为最小二乘最常见的一种情况,函数类取代数多项式,即k(x)xk,则近似函数为
则(k,l)xi1mklimAηb (8)
p(x)a0a1xa2x2anxn
(9)
,(k,y)xikyi,相应的法方程组为
i1
mmxii1m2xii1mxnii1xi1mmixi1mi1m2ixi1mi12ix3ixi3xi1mn1ixi4xi1mn2imxyii1i1mman10xxyiaiii11i1mm an222xxyiiii1i1anmmxnyxi2niii1i1nim(10)
5 基于QR分解的求解 最小二乘法的法方程组为
(ATA)ηATb (11)
上式可以采用LU分解法计算,当对A进行QR分解后,上式计算会更简单。 设AmnQmnRnn,其中Q为列标准正交矩阵,R为上三角矩阵且可逆,则
则法方程组可写为
ATA(QR)TQRRTQTQRRTR
(12)
作者:王安山 第 2 页
最小二乘法的数学研究
上式两端同时左乘(RT)1,得
(RTR)η(RTQT)b
(13)
RηQTb
由于R是上三角矩阵,所以可以直接回代。
注意,Q为列标准正交矩阵,只满足QTQE,而QQTE。
(14)
6 算例 已知数据点:
X Y 36.9 181 46.7 197 63.7 235 77.8 270 84.0 283 87.5 292 设近似函数p(x)abx,对应的法方程组为
66xii16xyiiai1i1 66bxi2xiyii1i16对应的代数方程为
6a396.9b1458 396.9a28365.28b101176.3解得:
a95.3524 b2.2337所得近似公式
y95.35242.2337x
作者:王安山 第 3 页