王全跃 朱海涛 马瑞霞 赵丹 王锐敏

摘 要:为了解决由于航路设计不足而导致的航迹与预定航路存在偏差的问题,基于数据挖掘的理论,采用时空航迹聚类、航迹相似度度量及分层聚类航迹方法分析了航迹航路偏差。采用Matlab软件处理了飞机飞行的ADS-B航迹数据,求得飞机飞行平均航迹。以天津上空航路网为例计算平均航迹。结果表明,此方法能分析出航迹与航路的偏差。

关键词:数据挖掘;ADS-B数据;航路;航迹偏差

引言

随着交通流的增大,飞行航迹与航路经常出现存在偏差的情况,原有设计的航路在一定程度上已不能够完全满足当前飞机运行需求。通过航路优化可以有效提高交通运行效率。

广播式自动相关监视(ADS-B)是一种基于全球卫星定位系统(GPS)和地/空,空/空数据链通信的航空器运行监视技术[1],具有数据量大、易获取的特点。文章以天津上空的航路为例分析,运用时空航迹聚类、航迹相似度量及分层聚类航迹方法,提出的基于ADS-B数据挖掘的航路航迹偏差分析研究方法,能够为航路优化提供参考。

1 天津上空航路分析

天津位于北京东南方向,距离北京110公里。去往北京和从北京机场出发的航班大部分都需要经过天津上空,且该地区航路复杂(天津上空的主要航路图如图1所示)。

天津地区上空的A461和A593航路,作为京广通道和京沪通道,是全国较繁忙的两条航路。从目前的航路和飞行航迹来看,飞行航迹并不完全与按照航路所设计的路线一致,这在一定程度上不利于交通流量的控制,需要通过研究航迹偏差的原因来调整现有航路结构。

2 应用到的聚类方法

2.1 时空轨迹聚类方法

时空轨迹是移动对象的位置和时间的记录序列[2]。时空轨迹是连续的,但通常用一组时空记录点序列,以离散的方式表示。对时空对象的实际轨迹曲线进行采样,用得到的集合来代表时空轨迹[3]。而航迹也可以看成是一种时空轨迹。因此,时空轨迹(航迹)的模型如式(1)所示:

式中:代表一条轨迹,序列中每一个(d+1)元组(xn,yn,tn)代表轨迹对象tn时刻在d维空间中的一个记录点,其空间位置是tn

为了能够从ADS-B轨迹数据中发现有用的信息,需要使用空间数据挖掘的方法,通过聚类识别出对象空间稠密和稀疏的区域,将数据中的相似性与异常特征提取出来,从而发现全局分布模式和数据属性间的关系。具体的研究思路图3所示。

具体思路如下:

首先,采用Hausdorff距离的方法对两两航迹进行相关性运算。

其次,计算一条航迹中一点到另一条航迹全部点的距离,求出d1,d2......dn;其次,求出该点到另一条航迹上全部点的最大距离,记为dmax;

再次,用该方法求得航迹上全部点到另一条航迹的最大距离;

最后,两条航迹的近似距离D可以用所有该航迹上的点到另一条航迹的距离中取最小值表示,得到两条航迹间的距离D后,就可以通过判断D来得到两条航迹的相关性。

其中,X表示航迹点的经度,Y表示航迹点的纬度,T表示采集到航迹点的时间。由于航迹数据采用的是按时间顺序排列,所以处理时就可以不用三维点而直接用二维坐标进行处理即可简化为:

两两航迹进行相关性运算,设两条航迹为:

一条航迹T中特定m(xn,xy)点到另一条航迹U的距离可以简化为欧式距离,即:

该点到另一条航迹的最大距离dmax(m)可以近似为:dmax(m)=max(d1,d2,......dn)

两条航迹的近似平均距离D可以用所有该航迹上的点到另一条航迹的距离dmax中取最小值可以近似看成两条航线间的距离D为:

D=min{dmax(1),dmax(2),dmax(3)......dmax(m),dmax(n)}

在通过对D进行判断,就可以得出两条航迹的相关性。

2.2 航迹相似度的度量方法

在这里,我们需要对D进行特殊分析。根据国内的国情,中国国内航路宽度设计标准一般为20km,所以我们度量的标准S也为20Km,相似度用距离来表示的话可以为R=■,判断R可以得到两条航迹间的相似度。当R>1时,表示两条航迹完全无关,当R>1时,表示两条航迹有相关性,R数值越小,两条航迹之间的平均偏差越小,两条航迹相似度越高。

2.3 分层聚类航迹分析

由于分层聚类是由不同层次的分割聚类组成,层次之间的分割具有嵌套的关系并且它不需要输入参数,因此采用文献[4]的分层聚类航迹分析方法,对航迹进行分层聚类分析,然后得到某航迹聚类Ci。

2.4 聚类的平均航迹构造

首先,针对聚类得到的航迹进行分析。在两导航台之间,每隔一定的距离取适当的航路点ti,把以该航路点为圆心,半径为一定距离的圆内所有航迹点的平均值作为平均航迹的航迹点(如图4所示)。航迹聚类所形成的平均航迹Mt是由沿进场方向离散的航迹点构成的。每个航迹聚类所形成的平均航迹从统计数据的角度描述了在指定条件下(如:时间段、航空器类别、跑道使用构型、管制负荷程度等)某条标准的飞行程序对应的最为典型的一个飞行轨迹。平均航迹的定义如下:

(1)平均航迹的航迹点Mt定义为向量集其中:nmt为航迹点的编号, 按距离大王庄VYK导航台的地理位置由近到远由小到大进行编号;nmt为航迹点总数,mpi为平均航迹中第i个航迹点;

(2)每一个航迹点mpi定义为一个二维的向量:mpi=(x,y),其中:x表示航迹点mpi的经度(横坐标);y表示航迹点mpi的纬度(纵坐标)。文中使用分量mpi(x),mpi(y)分别表示平均航迹中航迹点mpi的相关信息。

构造平均航迹的基本思想为:从大王庄(VYK)导航台开始,沿航路方向, 逐点构造每一个平均航迹点mpi来获得所有的平均航迹点集Mt。其中平均航迹点mpi可以通过计算该航路点为圆心、一定距离为半径的圆内所有航迹点的平均值,最后将平均航迹点连线成为平均航迹,具体处理过程为:

(1)需要选择航路上以3海里为间隔的点集作为基准航路点集,以保证平均航迹中每一个航迹点的构造都包含所有航迹的信息(不妨设该航路点集为Ti={nmt为航路点总数;

(2)计算以一个基准航路点ti为中心、半径为5海里的范围内航迹聚类Ci中所有航迹点的平均位置,得到一个新的位置坐标,即为平均航迹点mpi,用mpi=(x,y)表示。对航路上其余点用相同方法,通过逐个构造每一个平均航迹点来生成平均航迹Mt。再将所有平均航迹点连线,得到平均航迹。其满足: 平均航迹中每一条航迹的航迹点数量都与Ti相同,且任一条航迹中的航迹点都是与相同序号的航路点具有较好的局部相似性。

3 算例分析

应用上述航迹聚类和平均航迹构建方法对从大王庄到行唐航段进行实例研究。

(1) 将ADS-B航迹数据聚类,使用时空航迹聚类方法,用Hausdorff距离判断并找出与从大王庄到行唐航段相似的航迹,用分层分析的方法,将相似的航迹归为一类,得到航迹聚类C1,航迹聚类图如图5所示。

(2) 针对大王庄到行唐两个NDB导航台之间的航段,选取每隔3海里为一适当的航路点ti,把以该航路点为圆心,半径为5海里的圆内所有航迹点的平均值作为平均航迹的航迹点Mt,将所有平均航迹点连线构成该航段的平均航迹,平均航迹图如图6所示。

图5 某日大王庄-行唐航段ADS-B航迹数据聚类图

图6大王庄-行唐航段平均航迹图

4 结束语

文章利用数据挖掘的方法对ADS-B数据航迹偏差进行分析研究,结合时空航迹聚类、航迹相似度量及分层聚类航迹方法,求得飞机飞行平均航迹。并以天津上空航路为例,计算了平均航迹,对航迹偏差分析具有一定的借鉴意义。最后感谢中国民航大学提供的大学生创新创业资金的资助。

参考文献

[1]付强.ADS-B原理及在空中交通管制中的应用[D].吉林大学,2011.

[2]龚玺,裴韬,孙嘉,等.时空轨迹聚类方法研究进展[J].地理科学进展,2011.

[3]Nanni M. Clustering methods for spatio-temporal data. Pisa, Italy: University of Pisa[D].2002.

[4]王超,徐肖豪,王飞.基于航迹聚类的终端区进场程序管制适用性分析[J].南京航空航天大学学报,2013,45(1).

作者简介:王全跃,朱海涛,马瑞霞,赵丹,王锐敏,中国民航大学,空管学院学生。