王乐洋,李志强

(1.东华理工大学 测绘工程学院,江西 南昌 330013;2.山东建筑大学 测绘地理信息学院,山东 济南 250101)

大地测量数据处理所涉及到的观测模型一般为非线性模型[1-2],而非线性模型参数估计一直是测量平差所研究的重点问题之一。对于非线性模型,常用固有曲率和参数效应曲率来刻画非线性平差模型的非线性强度,进而评估参数估计的统计推断效果[3]。处理非线性模型的传统方法是线性最小二乘法,利用泰勒公式将非线性模型展开并截取至一次项[4]。对于非线性强度较高的模型,如三角网、导线网,线性近似将引起较大的模型误差[5-7]。随着测量技术的不断发展,对测量及平差的精度要求不断提高,因此,传统方法并不能满足当今科学技术的要求,而如何减弱模型线性化带来的模型误差成为了提高成果质量的重要内容。关于如何削弱模型误差影响,文献[7]通过对非线性函数求三阶偏导数,考虑了二次项及三次项的影响,提出了非线性模型参数估计的直接解法。为了有效地避免导数计算,可以通过函数差分的方法,利用快速差分迭代解算模型获取非线性最小二乘参数估值[8]。文献[9]研究了基于非线性最小二乘的空间三维直角坐标转换算法。针对测距定位方程该非线性平差模型,文献[10]给出了距离函数二阶导数的表达式,并推导了非线性平差的封闭牛顿迭代公式以及退化条件。对于非线性平差精度评定问题,可以从近似非线性函数的概率密度入手,采用无需求导的Sterling插值方法研究非线性函数的统计信息[11]。

目前,解决非线性最小二乘参数估计问题的方法主要分三类[12]:第一类是线性最小二乘法,用线性模型的理论与方法近似求解,其弊端在于当模型的非线性强度较强时,会产生较大的模型误差[6]。第二类是直接搜索算法,如模拟退火法、单纯形法、遗传算法等,其优势在于不需要求导计算,但是该类方法无法获得参数的解析解,且计算耗时很长[13]。第三类方法是迭代解法,如牛顿法、高斯牛顿法、改进的高斯牛顿法等[14]。牛顿法每次迭代时都需要计算目标函数的海森矩阵,当遇到非线性函数复杂时往往很难获得[12]。改进的高斯牛顿法与高斯牛顿法具有相同的迭代速率,但由于改进的高斯牛顿法在每次迭代时都需要确定一个步长因子,因此其计算量仍大于高斯牛顿法[13]。高斯牛顿法不仅具有牛顿法的收敛速率,而且每次迭代计算工作量相对最少[12],且在实际执行该算法前,总是通过某种方法求得一个靠近参数真值的解作为迭代初值进行解算,因此可以避免迭代算法受初值较差的影响,使其迭代收敛。

考虑到使用高斯牛顿迭代法解算非线性模型得到的参数估值并不能满足方差最小性和无偏性[15-17],考虑将Bootstrap采样方法引入非线性参数估计问题中。Bootstrap采样方法也称为自助法,该方法通过对观测数据的有放回随机采样,能够充分利用观测值的先验信息和数据性质,降低参数估值偏差,改善参数估值的质量。文献[18]首次提出了自助法,并给出了采样策略和相关证明,提出通过研究由重复采样得到的自助世界的经验分布来逼近真实分布的思想。文献[19]研究了确定置信区间的Bootstrap改进方法。针对结构复杂的数据,可以采用更具一般性的Bootstrap假设检验方法对统计量进行推断分析[20]。文献[21]综述了自助法在机器学习方面的应用和进展。针对自助法在标准差估计、偏差计算、回归分析、区间估计、置换检验、交叉验证等诸多方面的研究,也获得了丰富的成果[22-25]。自助法的研究主要集中在该方法在统计学上的性质,目前尚未发现将该方法用于非线性参数估计的论文出现。

本文从处理测角网坐标平差模型的传统方法出发,针对该方法在处理非线性模型时引起较大模型误差的局限性,采用高斯牛顿迭代方法求取未知点坐标;为减小迭代计算产生的偏差,引入Bootstrap采样方法,从而进一步改善参数估值质量。针对等精度和不等精度观测数据,本文通过两个案例研究并与传统方法进行对比分析,来验证本文方法的有效性和优势性。

1 测角网坐标平差模型及其高斯牛顿迭代解法

以角度为观测值、未知点坐标为参数的平差模型,称为测角网坐标平差模型。为直观表示,假设角度测量的示意图如图1所示,其中点j为顶点,∠hjk为待测角。

图1 测角示意图

假设测角观测方程的向量表达式为:

L=f(X)+ε.

(1)

式中:L∈Rn×1为相互独立的角度观测值向量;X∈Rt×1为未知点坐标向量;f(·)表示非线性映射关系,f(X)为n个非线性函数组成的向量;ε∈Rt×1表示角度观测误差向量。

用未知点坐标估值和测角真误差的估值分别代替其真值,得测角网模型的误差方程:

(2)

(3)

(4)

矩阵表达形式为:

v=Bx-l.

(5)

式中:B为误差方程的系数矩阵,x为未知点坐标改正数向量,l为误差方程常数项向量。

根据最小二乘原理,加权最小二乘解为[26-27]:

x=(BTPB)-1BTPl.

(6)

式中:P是角度观测值的权阵。

最后可得测角网模型未知点坐标估值为:

(7)

式中:X0为未知点坐标初值。

(8)

(9)

将高斯牛顿解法用于求解测角网坐标平差模型的关键,是每步迭代后都需要及时更新系数矩阵B及常数项向量l。因此,分析归纳误差矩阵及常数项向量的特点和性质就显得尤为重要。

假设式(4)的系数为:

(10)

等价于

(11)

式中:ai,bi,ci,di由式(10)求得,其数值的正负取决于坐标增量ΔX,ΔY的正负;(+ai),(-ai),(+bi),(-bi),(+ci),(-ci),(+di),(-di)的正负由坐标增量与式(6)中的正负号共同决定。

由图1可知,对于所有观测角度L,其误差方程总共存在7种表达形式,见表1。

表1 误差方程的不同形式

根据高斯牛顿迭代原理及系数矩阵及常数项向量的更新规律,测角网坐标平差的高斯牛顿迭代解法总结为算法1。

算法1:高斯牛顿迭代解法。

1)利用余切公式获取迭代初值X0;

2)计算各基线边的坐标增量ΔX,ΔY及边长S;

3)由式(10)计算系数ai,bi,ci,di,并获取Bk;

4)计算各基线边的近似坐标方位角α0,得到lk;

2 测角网坐标平差模型的Bootstrap参数估计方法

Bootstrap采样方法通过重采样给定观测数据获取自助样本来统计推断未知参数,该方法通过对已知样本(假设样本容量为n)做有放回随机循环抽样,得到M个样本容量仍为n的自助样本,进而估计原始样本的有效信息。自助法能充分利用总体包含在原始样本中的所有信息,使得自助样本的分布能够不断逼近原始样本统计量的分布。该方法的优势性在于它不需要对未知模型及分布做任何假设,也无需推导估计量的精确表达式,只需通过检验样本内统计量的变化来估计未知参数的整个抽样分布,即对观测值进行重采样并计算估计值[21]。

(12)

根据Bootstrap方法采样策略、高斯牛顿迭代原理及系数矩阵和常数项向量的更新规律,测角网坐标平差模型的Bootstrap参数估计方法总结为算法2。

算法2:Bootstrap重采样方法。

1)假设原始观测值样本N=(L1,L2,…,Ln)为观测总体,其权阵为P=(P1,P2,…,P3);

2)产生n个随机数(i1,i2,…,in),其中1≤iu≤n,(u=1,2,3,…,n);

3)对N中的观测值进行采样,获取自助样本Nr=(Li1,Li2,Li3,…,Lin),其中1≤r≤1 000;

5)根据自助样本中的角度数据,利用余切公式获取坐标迭代初值X0;

6)计算采样到的基线边的坐标增量ΔY,ΔX及边长S;

7)由式(10)计算系数ai,bi,ci,di,并获取系数矩阵Bk;

8)计算采样到的基线边的近似坐标方位角α0,并获取常数项向量lk;

12)通过式(12)计算未知点坐标的自助估计值。

根据以上计算步骤,可以得到测角网坐标平差模型的Bootstrap参数估计算法迭代流程图,如图2所示。

图2 测角网坐标平差模型的Bootstrap参数估计算法迭代流程图

从上述迭代步骤可以看出,所有自助样本中包含的样本数据均来源于原始样本,并未根据更多的观测信息进行计算,所以测角网坐标平差模型的Bootstrap参数估计方法与高斯牛顿算法均是利用相同的角度观测数据最终得到未知点坐标估值。

3 算例及分析

3.1 案例1:独立等精度情况

模拟一个加密控制网,如图3所示。网中A,B,C,D是已知三角点,P是待定点,独立等精度获取12个观测角度,已知点的坐标数据见表2。

图3 测角网示意图

表2 已知点数据 m

表3 自助法计算参数估值的过程

从表3可以看出,自助法采样过程将原始观测数据采样成了多个自助样本,虽然每个自助样本的样本容量与原始样本相同,但并不是改变观测值的先后排列顺序。有放回随机抽样过程使得每个自助样本中可能存在重复的原始数据点,而另外一些原始样本点没有出现。因此,每个自助样本将随机地异于原始样本,导致每个自助样本获得的参数估值存在细微差异。

采用最小二乘法(LS)、基于最小二乘的Bootstrap方法(LSB)、算法1(GNI)及算法2(GNIB)计算该测角网中未知点坐标,各方法的参数估值、范数结果见表4。LSB法的具体表现为在获取自助样本后、通过LS方法来解算自助样本获取未知点坐标参数。

表4 参数估计结果

从表4结果可以看出,经典LS法得到的坐标估值与参数真值偏离较大。考虑到参数估值的真误差一般由观测误差以及线性近似所引起的模型误差共同影响。而针对非线性强度很强的测角网模型,在具有相同观测误差的角度观测值情况下,LS法得到的参数估值最差,表明LS法在线性近似的过程中,引入了较大的模型误差,从而严重影响坐标估计值的质量。相比于LS法及LSB法,基于逐步线性化的GNI法得到的参数估值更接近于参数真值,表明GNI法通过反复迭代的确能够削弱线性近似所带来的模型误差的影响,使其参数估值精确度比传统方法有较为明显的提高。

同时,相比于传统的LS法,LSB法能够改善参数估值的质量;而相比于GNI法,GNIB法在估计值的精确度方面也有较明显的提升,且均优于LS法及LSB法。表明将自助法与传统的最小二乘法及高斯牛顿迭代法结合是可行且有效的。自助法的循环有放回随机采样过程获得的自助样本能够充分利用角度观测值先验信息,而且该采样过程不会产生额外的模型误差,也不会改变模型态性。尤其是GNIB法,其大量的自助样本能够减小GNI法计算坐标估值产生的偏差,从而使得GNIB法获得的坐标估值最接近真值。从实验结果可以看出,算法2除具备算法1的优点外,其采样角度观测值获得的大量自助样本可以减小GNI法计算产生的偏差,进而改善参数估值的质量。

3.2 案例2:独立不等精度情况

模拟一个更复杂的测角网,如图4所示。网中A,B,C,D是已知点,P1,P2是待定点,独立不等精度观测了18个角度,已知点坐标值见表5。

图4 测角网示意图

表5 已知点数据 m

表6 角度观测数据

针对不等精度的测角网观测数据,自助法获取自助样本及参数估值的具体实施过程见表7。

表7 Bootstrap参数估计方法重采样过程

XLFXL从表7的自助采样过程可以看出,针对不等精度观测数据,自助法重采样获取自助样本的过程中,需要对观测值及其权值同步采样,保持观测值与其权值相对应。自助法通过有放回随机抽样将样本容量为18的原始角度观测值样本采样成M个自助样本,该过程并不是改变观测值的先后排列顺序,其采样过程使得某些原始数据点重复出现,而另外一些原始样本点没有被采样到。因此,利用高斯牛顿解算每个自助样本得到的未知点坐标估值存在细微差异。

分别采用线性加权最小二乘法(WLS)、基于加权最小二乘的Bootstrap方法(WLSB)、算法1(GNI)以及算法2(GNIB)对该测角网进行参数估计,各方法的参数估值、范数结果见表8。为更好地实现实验对照,WLSB法是WLS法与Bootstrap方法结合后的方法,具体表现为通过WLS法来解算自助样本。

表8 参数估计结果

由表8的结果可以看出,传统WLS法获取的坐标估值质量最差,是由于该方法需要利用泰勒级数对测角网模型进行线性化处理,在截断取至一次项的过程中不可避免地引入了线性化模型误差。对于非线性强度很强的测角网模型,线性近似将产生大于观测误差的模型误差,该误差极易引起参数估值与真值偏离较大;当坐标初值计算不准确时,将严重影响坐标估计值的质量。而相比于WLS法和WLSB法,GNI法得到的参数估值最优,说明GNI法能够减弱测角网函数模型线性近似所带来的模型误差的影响,其循环迭代过程可以不断修正参数估值,在一定程度上能够有效改善传统WLS法对测角网模型线性化过程中所引起的精度损失,使其参数估值比传统的线性近似方法更接近参数真值。

相比于传统的WLS法,WLSB能够提高参数估值的质量;而相比于GNI法,GNIB法在参数估值的精确度方面也具有一定的提升。结果表明自助法同样适用于不等精度的角度观测数据。由于自助法重采样不需要对模型及分布做任何假设,也无需推导参数估值的精确表达式,而有放回随机采样过程获得的自助样本能够更好地包含原始观测值的先验信息和数据性质。尤其是GNIB法,其大量的自助样本能够减小GNI法计算产生的偏差,提高参数估值的精确度。实验验证了自助法在重采样不等精度观测数据时需要对观测值的权值同步采样的正确性,也再次验证了将自助法与高斯牛顿迭代法相结合、并用于测角网坐标平差模型的有效性与优势。

4 结束语

本文介绍了测角网坐标平差模型和Bootstrap重采样理论,将高斯牛顿迭代解法应用于测角网坐标平差模型,并在此基础上结合自助法,提出了测角网坐标平差模型的Bootstrap参数估计算法,并给出了详细的采样步骤及计算流程图。针对等精度与不等精度的独立观测数据,将本文方法用于两个测角网案例,并与传统的加权最小二乘法和基于加权最小二乘的Bootstrap方法求取的坐标估值进行比较。由于测角网模型的非线性强度较强,经典的加权最小二乘法在对测角网模型进行线性化处理过程中引入了较大的模型误差,导致其坐标估值与真值偏离较大。而高斯牛顿法通过迭代削弱了因线性近似带来的模型误差的影响,有效改善传统最小二乘法对测角网模型线性化所引起的参数精度损失,使其坐标估值比传统方法获得的结果更加准确。测角网坐标平差模型的Bootstrap参数估计算法具备了除高斯牛顿迭代法的所有优点外,由于其重采样过程不仅不会产生额外的模型误差,而且能够充分利用角度观测值性质,其大量的自助样本能够减小高斯牛顿迭代计算产生的偏差,进一步提高参数估值的精确度。算例验证了将高斯牛顿迭代解法应用于测角网坐标平差模型的必要性与实用性,也验证了将Bootstrap参数估计方法用于测角网坐标平差模型的有效性与优势性。

在计算效率方面,自助法通过重采样观测值得到M个自助样本,其解算过程尽管会增加计算耗时,但是其原理简单、适用性强,易于理解和编码,且重采样次数M可调,它仅需要通过计算机重复解算自助样本便可改善未知参数的质量,不失为一种较好的参数估计方法。本文方法同样也适用于观测值相互独立的非线性模型参数估计问题,本文仅以测角网坐标平差为例。随着自助法的首次引入测角网坐标平差模型中,将拓展自助法在参数估计中的应用,也将是非线性平差理论研究的一个重要补充。

Bootstrap采样方法依赖于原始观测数据的样本容量,足够的观测数据对提高参数估值的自助估计十分重要。此外,对于相关观测数据的非线性平差及提高计算效率的问题还需要进一步研究。