| Issue |
JNWPU
Volume 44, Number 1, February 2026
|
|
|---|---|---|
| Page(s) | 185 - 193 | |
| DOI | https://doi.org/10.1051/jnwpu/20264410185 | |
| Published online | 27 April 2026 | |
BiGRU-MHA-KAN based flight training trajectory prediction
基于BiGRU-MHA-KAN的飞行训练轨迹预测方法
1
Engineering Technology Training Center, Civil Aviation University of China, Tianjin 300300, China
2
School of Electronic Information and Automation, Civil Aviation University of China, Tianjin 300300, China
Received:
14
May
2025
Abstract
To improve the accuracy of trajectory prediction in flight training and enhance the reliability of prediction models, a deep hybrid neural network model named BiGRU-MHA-KAN is proposed, in which the bidirectional gated recurrent unit(BiGRU), multi-head attention(MHA) and Kolmogorov-Arnold networks(KAN) are integrated. The model strengthens the temporal feature extraction and nonlinear dynamic modeling through trajectory data preprocessing and reconstruction, combining with the bidirectional modeling, attention mechanisms and KAN networks. Simulated experiments systematically analyze the effect of the different parameter settings and historical data volumes on the model performance. The results demonstrate that, comparing with the other trajectory prediction models, the present method achieves an improvement in prediction accuracy by 4.81%-5.83%, while significantly reducing the mean squared error and root mean squared error, demonstrating the stronger temporal modeling capability and stability in flight training scenarios.
摘要
为提升飞行训练中轨迹预测的精确度, 优化预测模型的可靠性, 提出了一种融合双向门控循环单元(BiGRU)、多头注意力机制(MHA)与Kolmogorov-Arnold网络(KAN)的深度混合神经网络模型BiGRU-MHA-KAN。该模型通过航迹数据预处理与重构, 结合双向建模、注意力机制和KAN网络, 强化时序特征提取与非线性动态建模。仿真实验系统分析了不同参数设置及历史数据量对模型性能的影响。结果表明, 相较于其他轨迹预测模型, 所提方法将预测准确提高了4.81%~5.83%, 且均方误差与均方根误差显著降低, 在飞行训练场景下展现出更强的时序建模能力和稳定性。
Key words: trajectory prediction / flight training / Kolmogorov-Arnold networks / bidirectional gated recurrent unit / attention mechanisms
关键字 : 轨迹预测 / 飞行训练 / KAN网络 / 双向门控循环单元 / 注意力机制
© 2026 Journal of Northwestern Polytechnical University. All rights reserved.
This is an Open Access article distributed under the terms of the Creative Commons Attribution License (https://creativecommons.org/licenses/by/4.0), which permits unrestricted use, distribution, and reproduction in any medium, provided the original work is properly cited.
随着我国航空运输业的快速发展,行业对飞行员需求不断增长,飞行员的规范化和高水平训练成为保障航空安全的关键环节。目前,经验驱动型训练模式依赖于教员主观经验与仪表参数的离散化反馈,无法实现对学员飞行轨迹的实时预测和量化评估。传统轨迹预测训练模式主要基于数学模型和统计分析,在应对动态复杂的飞行场景时存在显著局限性。随着广播式自动相关监视技术全面覆盖,基于机器学习的轨迹预测方法得到了广泛关注。然而,该方法对于高质量标签数据的需求量较大,且在数据不足或特征复杂时预测模型性能下降[1]。
为解决上述问题,深度学习方法提供了新的思路和路径。张宏鹏等[2]利用门控循环单元(gated recurrent unit, GRU)预测轨迹。付茂洺等[3]根据时间序列飞行数据的特点利用长短期记忆网络(long short-term memory, LSTM)建立预测模型。Hu等[4]提出一种结合时间序列卷积神经网络和LSTM的混合模型,预测高速飞机的位置和速度。方伟等[5]结合LSTM和残差神经网络预测轨迹。张宗腾等[6]通过双向门控循环单元(bidirectional gated recurrent unit, BiGRU)网络提高轨迹信息利用率。然而,该网络在处理高度复杂的非线性数据时,仍存在一定的局限性。本研究提出BiGRU-MHA-KAN三重机制架构,通过BiGRU网络实现时空特征融合;结合多头注意力机制(multi-head attention, MHA)强化关键特征捕获能力;引入科尔莫哥罗夫-阿诺德(Kolmogorov-Arnold networks, KAN)网络[7],建立非线性映射通路,有效解决复杂轨迹建模中的非线性表征难题,提升飞机轨迹预测精度。
1 基础理论研究
1.1 BiGRU网络
鉴于飞行轨迹同时受历史状态与未来意图影响的特性,本研究采用BiGRU网络提取时序特征。该网络通过并行的正、反向GRU模块,分别捕获历史演进规律与潜在趋势特征,更全面地提取长序列数据的上下文关联信息[8],同时保持GRU网络参数量少、训练效率高等优势。
更新门zt
(1)
重置门rt
(2)
候选隐藏状态 
(3)
最终隐藏状态ht
(4)
zt调节ht-1的保留比例和
的吸收程度, rt控制对ht-1的影响程度。输入特征xt经rt筛选历史信息后, 与当前输入共同生成
。ht通过zt对ht-1和
实现加权融合。模型参数包含可训练权重矩阵(Wr, Wz, Wh)及偏置向量(br, bz), 通过反向传播优化。激活函数配置为: σ(Sigmoid)实现门控值(0, 1)归一化, tanh将候选状态约束至(-1, 1)区间。
第n层的正向隐藏状态
与反向隐藏状态
分别按时间正序和逆序计算。最终通过张量拼接实现时空特征表征
(5)
1.2 MHA机制
针对传统BiGRU模型时序建模中存在的特征均等化缺陷,本研究提出多头注意力增强架构。该架构采用特征空间解耦策略,将输入序列通过3个可学习权重矩阵WQ, WK和WV经线性变换形成查询矩阵Q、键矩阵K和值矩阵V,沿特征维度拆分为h个正交子空间。在每个子空间中进行自注意力计算时,通过缩放点积运算建立元素间关联。
(6)
式中: dk为键向量的维度, 用于调节点积值的量纲。
将h个独立子空间的注意力输出进行特征融合
(7)
(8)
式中: WO为输出投影矩阵; 1≤i≤h, h表示子空间个数; concat表示沿特征维的拼接操作。
1.3 KAN网络
针对飞行训练轨迹的多参数输入高维非线性映射问题, 引入基于Kolmogorov Arnold表示定理[9]的新型KAN网络。如图 1所示, 该网络依托定理核心特性[10], 通过可学习样条基函数替代静态权重参数, 结合自适应函数组合策略, 以较少参数实现高维非线性关系的高效拟合。
![]() |
图1 KAN网络结构示意图 |
该网络的优越性已在多研究领域得到验证: 袁立宁等[11]将其引入图深度学习领域, 有效规避了图卷积网络对显式信息传递策略的依赖。Al-Qaness等[12]借助该网络提高了肌电信号分类精度。Ren等[13]采用样条函数网格细化策略, 增强了函数逼近精度。Sidharth等[14]将逼近论的理论基础与切比雪夫多项式相结合, 成功捕捉了分形结构中的复杂模式与变化。
KAN网络是由内外函数组成的双层级联结构: 内部函数层实现n维输入到2n+1维输出的非线性变换, 外部函数层将2n+1维特征映射至n维输出空间。公式为
(9)
式中: KAN(x)代表输入x的预测值; Φq(·)和ϕp, q(·)为可训练函数; ϕp, q(xp)为第q与第p项的函数组合, xp为输入向量的第p个分量; Φq为高维特征的合成映射。
为提升网络优化效率, 采用残差激活策略。通过引入基函数b(x), 使可训练激活函数ϕ(x)表示为
(10)
式中, 样条函数spline(x)为一维函数组合, 表示为B样条曲线的线性组合; ws和wb为可训练变量, b(x)为固定形式SiLU函数。其中
(11)
(12)
式中:Bi(x)为相关的样条函数;ci为权重系数。
样条函数受2个关键参数的影响: 样条阶数和节点密度。其中, 样条阶数指在控制点之间进行多项式插值的函数阶数, 并决定了每段样条曲线的平滑程度和拟合能力。节点密度表示样条插值中控制点的数量,影响样条函数捕捉输入特征细节变化的能力[15]。因此, 样条阶数与节点密度共同决定了KAN的非线性建模能力, 是影响模型性能的核心参数。
2 深度混合预测模型设计
2.1 飞行数据多维度时序重构
飞行训练轨迹可表示为一系列离散时序数据点, 每个轨迹点包含经度、纬度、高度等信息。以地面坐标系OXYZ为基准, 飞行轨迹T可表示为t个时序点, 公式为
(13)
式中: (xt, yt, zt)为飞机在时刻t的坐标值。飞机的运动轨迹可在OXYZ坐标系上沿着X, Y, Z轴正交分解, 且相对独立。现以X轴为例(Y, Z轴同理), 其运动轨迹数据集X为
(14)
预测轨迹数据集
为
(15)
则飞行轨迹预测问题可描述为
(16)
式中, f(·)表示预测模型函数映射关系。
如图 2所示, 时间序列数据重构流程为: 在航迹数据间隔为1 s的条件下, 从首个航迹点开始, 将连续w个输入点与后续时间戳相邻的p个航迹点进行组合形成一个时间窗。该操作以滑动窗口方式重复执行, 直至覆盖轨迹的第p个航迹点, 其中n为选取轨迹样本的总长度。
![]() |
图2 时间序列数据重构图 |
2.2 BiGRU-MHA-KAN模型架构
针对BiGRU在时序特征学习中的特征均等化缺陷及KAN网络在时序依赖捕获的局限性, 本研究提出三级递进式BiGRU-MHA-KAN融合架构, 如图 3所示。尽管BiGRU-MHA模块已具备时序特征捕捉能力, 但传统全连接层在处理高维非线性飞行参数映射时仍存在函数逼近不足的缺陷。因此, 引入KAN网络替代传统全连接层, 利用其基于样条基函数的非线性映射能力对注意力加权特征进行非线性变换, 提升复杂非线性时间序列预测的表征能力。
![]() |
图3 BiGRU-MHA-KAN模型结构图 |
在该模型中, 双层BiGRU-MHA作为时间序列特征提取模块: 第一层BiGRU-MHA负责提取时间序列特征, 第二层BiGRU-MHA深化轨迹特征关联挖掘, 学习更深层次的时间序列信息。而KAN则作为非线性映射模块, 接收BiGRU-MHA的加权特征表示输出, 通过(10)~(13)式的样条基函数实现非线性映射。其模型训练如图 4所示。
![]() |
图4 BiGRU-MHA-KAN模型训练流程图 |
3 仿真实验及结果分析
本研究利用真实的飞行数据对轨迹预测模型BiGRU-MHA-KAN进行仿真实验, 并与GRU、LSTM等多种神经网络模型开展对比实验, 以评估和验证该模型的可行性和优越性。
3.1 数据集构建与预处理
本研究采用国外OpenSky网络公开的ADS-B数据集。该数据集的采样频率为2 Hz, 主要包括Unix时间戳、飞机识别号、飞机位置、气压高度、应答传感器数量和测量数据等信息。
依据Unix标准化时间格式, 将数据集时间戳的信息转化为真实时间。提取同一架飞机的经度、纬度和高度三维空间数据, 按照真实时间的顺序, 形成独立的csv文件。
生成的数据集的飞行数据量共6 259, 其中80%的数据量作为训练集, 其余20%作为测试集。该模型训练采用Adam优化策略, 学习率设定为0.01。仿真运行环境为Pytorch平台。
航迹预测输出的结果包括预测位置点的经度、纬度和高度, 因此, 根据(13)式可得航迹预测点的输出数据结构为
(17)
为了优化模型对数据特征的学习效率, 采用归一化方法, 将数据映射到[0, 1]的范围内, 以消除突变样本对模型的影响, 公式为
(18)
式中: ξ为航迹数据
中的元素, 包含经度、纬度以及高度; ξmin为航迹数据集中的最小值; ξmax为航迹数据集中的最大值; ξ′为归一化后的航迹数据。
获得航迹预测数据后, 需要经过反归一化处理以恢复数据的原始尺度, 公式为
(19)
3.2 对比实验
3.2.1 评价指标
本研究构建了包含预测偏差率、预测准确率、多维度绝对误差、平均绝对误差(mean absolute error, MAE)、均方根误差(root mean square error, RMSE)及推理时间和吞吐率的多维度量化评估体系。
预测偏差率采用逐点绝对误差进行量化表征, 公式为
(20)
式中: n为超前预测的时刻点总数;
为t时刻轨迹的预测值; Tt为t时刻轨迹的真实值。
预测准确率P的判定机制基于多维度误差阈值。首先计算经度、纬度及高度的三轴相对误差Et, 设定预设误差阈值ε; 当且仅当三轴误差均满足阈值条件时, 判定该轨迹点预测准确, 并累加至正确预测的轨迹点数量
, 公式为
(21)
(22)
(23)
式中: N为测试点总数量。
3.2.2 KAN网络参数敏感性分析
在BiGRU-MHA-KAN模型中,KAN网络通过样条函数实现非线性关系的精确建模,其拟合能力直接影响模型的整体性能。因此,需要通过敏感性分析,探究B样条插值阶数s(spline-order)和节点密度g(grid-size)对模型性能的影响。根据文献[16-17]中选取数据长度的方式,以10 s历史数据预测2 s未来数据为例,利用平均准确率和偏差率评估KAN网络参数中的B样条插值的阶数和节点密度对模型的影响。
1) 样条插值阶数影响
为了便于实验分析,在设定节点密度为5的条件下,探讨了不同样条插值阶数取值对模型性能的影响。从图 5a)~5b)可以看出,当样条插值阶数过大时,模型在收敛过程中平均准确率反而会有所下降。
![]() |
图5 KAN网络关键参数的敏感性实验结果 |
为确保模型维持较高准确率,样条插值阶数的理想取值区间为[1, 4],若超出该范围,模型性能会出现显著下降。尽管高样条插值阶数有助于提升模型的灵活性,但也易引发过拟合。因此,样条插值阶数的合理选择是模型性能优化的关键因素。
2) 样条节点密度影响
控制样条插值中使用的控制点数量,决定了样条节点密度和网格大小。g过小会导致平均准确率曲线上升缓慢、准确率偏低且偏差率较高;g过大则会使迭代曲线呈现明显振荡。需注意的是,图 5c)中节点密度g=10的模型训练初期准确率提升较慢。这表明控制点数量增加虽能增强模型表达能力,但会扩大优化空间复杂度,进而延缓训练初期的收敛速度;而g较小的模型因结构更简洁,在训练初期更易收敛,从而准确率提升更快。
由图 5c)~5d) 可以看出,节点密度的理想取值区间为[5,9]。样条节点密度较小会导致模型细节捕捉能力不足,降低预测性能;节点密度较大虽能提升细节捕捉能力,但易引发过拟合。因此,节点密度的合理选取同样对模型性能优化至关重要。
3.2.3 轨迹预测验证分析
为评估预测效果,本研究构建包含GRU、LSTM、BiGRU、BiLSTM及BiGRU-MHA-KAN网络的对照实验,各模型网络参数如表 1所示。利用不同的历史飞行轨迹数据预测未来轨迹,并每10回合计算准确率与偏差率的平均值。
网络参数取值表
1) 1 s历史数据的短时轨迹预测
基于1 s历史飞行数据预测未来1 s的飞行训练轨迹。如图 6a)~6b)所示,GRU、LSTM网络预测效果欠佳。引入双向传播机制的BiGRU、BiLSTM网络因双向结构有效捕捉轨迹序列双向依赖关系表现更优。引入KAN网络与多头注意力机制后,MAE和RMSE显著降低,模型关键信息捕获与非线性表达能力均得到提升。
![]() |
图6 1 s历史数据预测过程结果图 |
表 2结果显示,BiGRU-MHA-KAN模型平均准确率达97.12%, 平均偏差率为1.78%,RMSE与MAE也均为最低值。图 6c)中该模型损失函数曲线稳定下降,收敛性良好,训练拟合效果佳,整体稳定性与精度更优。
1 s历史数据的轨迹预测评价指标
如图 7所示,LSTM网络误差波动显著、幅度较大。引入双向结构后各网络模型的预测效果均有所改善,而融合KAN与多头注意力机制的BiGRU模型,不仅预测轨迹与真实轨迹重合度高、整体偏离最小,预测误差也最小,预测性能最优,进一步验证了其在飞行轨迹预测任务中的优越性。实时性方面,该模型吞吐率116 235 s-1、单样本推理时间8.6 μs,远低于0.5 s航迹点采样间隔,虽推理时间较传统GRU略有增加,但在精度大幅提升的同时仍保持良好实时性与计算效率。
![]() |
图7 1 s历史数据不同维度的预测误差对比图 |
2) 10 s历史数据的短时轨迹预测
基于10 s历史飞行数据预测未来1 s的飞行训练轨迹。表 3结果同样显示BiGRU-MHA-KAN模型的平均准确率最高、平均偏差率及MAE、RMSE均为最低,表明其处理长历史信息时,仍能保持高精度输出与稳定性能。该模型单样本推理时间13.8 μs、吞吐率72 508 s-1,进一步表明BiGRU-MHA-KAN模型在历史输入长度增加的情况下,仍具备良好的实时响应能力。
10 s历史数据的轨迹预测评价指标
如图 8a)~8c)所示,GRU网络预测效果最差,LSTM次之,同样BiGRU、BiLSTM网络的预测效果有所改善,再次验证了双向结构的有效性。与利用1 s历史数据的实验结果类似,引入多头注意力机制与KAN网络后,BiGRU-MHA-KAN模型的平均准确率曲线上升,而平均偏差率曲线下降,网络损失函数曲线持续走低,有效解决了关键信息捕获均等化与非线性表达能力有限的问题,同样展现出良好的预测准确性。从图 9中可以看出,BiGRU-MHA-KAN模型在不同维度的预测误差最小,进一步证明了该模型在飞行轨迹预测领域的性能优势更为突出。
![]() |
图8 10 s历史数据预测过程结果图 |
![]() |
图9 10 s历史数据不同维度的预测误差对比图 |
4 结论
本文利用融合BiGRU的时序建模能力、MHA的特征选择机制,以及KAN可学习非线性逼近特性,构建了BiGRU-MHA-KAN深度混合神经网络模型,实现了复杂飞行轨迹的高精度预测,解决了飞行训练轨迹预测中面临的高维非线性建模难题。该模型预测准确性与误差控制性能优于其他模型,且预测能力与历史信息长度呈显著正相关。KAN的样条参数配置对模型性能起关键作用。未来可引入多源数据与强化学习机制,进一步提升模型在复杂环境中的实时预测能力,并推动其在飞行训练系统中的广泛应用。
References
- Möller D P F. Machine learning and deep learning[M]. Cham: Springer Nature Switzerland, 2023: 347–384 [Google Scholar]
- Zhang Hongpeng, Huang Changqiang, Tang Shangqin, et al. CNN-based real-time prediction method of flight trajectory of unmanned combat aerial vehicle[J]. Acta Armamentarii, 2020, 41(9): 1894–1903 (in Chinese) [Google Scholar]
- Fu Maoming, Chen Jizong. LSTM model-based flight trajectory prediction for airport flights[J]. Modern Computer, 2022, 28(14): 55–60 (in Chinese) [Google Scholar]
- Hu Y C, Dai J, Yi J, et al. The high-speed aircraft trajectory prediction method based on deep learning network[J]. Journal of Physics, 2023, 2489(1): 012023 [Google Scholar]
- Fang Wei, Tang Miao, Yan Wenjun, et al. Flight trajectory prediction based on residual neural network and LSTM[J]. Ship Electronic Engineering, 2023, 43(10): 42–46 (in Chinese) [Google Scholar]
- Zhang Zongteng, Zhang Lin, Wang Wenfeng, et al. A method for UAV flight trajectory prediction based on bidirectional GRU[J]. Electronics Optics & Control, 2022, 29(3): 11–15 (in Chinese) [Google Scholar]
- Liu Z, Wang Y, Vaidya S, et al. KAN: Kolmogorov-Arnold networks[EB/OL]. (2024-04-30)[2026-01-24]. [Article]. [Google Scholar]
- Dai Y, Yu W, Leng M. A hybrid ensemble optimized BiGRU method for short-term photovoltaic generation forecasting[J]. Energy, 2024, 299: 131458. [Article] [Google Scholar]
- Somvanshi S, Javed S A, Islam M M, et al. A survey on Kolmogorov-Arnold network[J]. ACM Computing Surveys, 2025, 58(2): 1–35 [Google Scholar]
- Polar A, Poluektov M. A deep machine learning algorithm for construction of the Kolmogorov-Arnold representation[J]. Engineering Applications of Artificial Intelligence, 2021, 99: 104137. [Article] [Google Scholar]
- Yuan Lining, Feng Wengang, Liu Zhao. Node classification based on Kolmogorov-Arnold network[J]. Journal of Frontiers of Computer Science and Technology, 2025, 19(3): 645–656 (in Chinese) [Google Scholar]
- Al-Qaness M A A, Ni S. TCNN-KAN: optimized CNN by Kolmogorov-Arnold network and pruning techniques for sEMG gesture recognition[J]. IEEE Journal of Biomedical and Health Informatics, 2025, 29(1): 188–197. [Article] [Google Scholar]
- Ren D, Hu Q, Zhang T. EKLT: Kolmogorov-Arnold attention-driven LSTM with transformer model for river water level prediction[J]. Journal of Hydrology, 2025, 649: 132430. [Article] [Google Scholar]
- Sidharth S S, Keerthana A R, Gokul R, et al. Chebyshev polynomial-based Kolmogorov-Arnold networks: an efficient architecture for nonlinear function approximation[J/OL]. (2024-05-12)[2026-01-24]. [Article] [Google Scholar]
- Vaca-Rubio C J, Blanco L, Pereira R, et al. Kolmogorov-Arnold networks(KANs) for time series analysis[C]//2024 IEEE Globecom Workshops, Cape Town, South Africa, 2024. [Google Scholar]
- Zhang Kun, Du Ruiyi, Shi Haotian, et al. Prediction of aircraft trajectory based on Mogrifier-BiGRU[J]. Acta Armamentarii, 2024, 45(2): 373–384 (in Chinese) [Google Scholar]
- Luo Kaiwei, Zhou Jiliu. Flight trajectory prediction method based on large language models[J]. Application Research of Computers, 2025, 42(12): 3644–3650 (in Chinese) [Google Scholar]
All Tables
All Figures
![]() |
图1 KAN网络结构示意图 |
| In the text | |
![]() |
图2 时间序列数据重构图 |
| In the text | |
![]() |
图3 BiGRU-MHA-KAN模型结构图 |
| In the text | |
![]() |
图4 BiGRU-MHA-KAN模型训练流程图 |
| In the text | |
![]() |
图5 KAN网络关键参数的敏感性实验结果 |
| In the text | |
![]() |
图6 1 s历史数据预测过程结果图 |
| In the text | |
![]() |
图7 1 s历史数据不同维度的预测误差对比图 |
| In the text | |
![]() |
图8 10 s历史数据预测过程结果图 |
| In the text | |
![]() |
图9 10 s历史数据不同维度的预测误差对比图 |
| In the text | |
Current usage metrics show cumulative count of Article Views (full-text article views including HTML views, PDF and ePub downloads, according to the available data) and Abstracts Views on Vision4Press platform.
Data correspond to usage on the plateform after 2015. The current usage metrics is available 48-96 hours after online publication and is updated daily on week days.
Initial download of the metrics may take a while.









