Open Access
Issue
JNWPU
Volume 42, Number 2, April 2024
Page(s) 328 - 334
DOI https://doi.org/10.1051/jnwpu/20244220328
Published online 30 May 2024

© 2024 Journal of Northwestern Polytechnical University. All rights reserved.

Licence Creative CommonsThis is an Open Access article distributed under the terms of the Creative Commons Attribution License (https://creativecommons.org/licenses/by/4.0), which permits unrestricted use, distribution, and reproduction in any medium, provided the original work is properly cited.

当代, 各类飞行器的研制已经成为了我国重点关注的领域, 而对气动力数据进行可靠的建模是飞行器稳定发展的重要前提和赖以存在的基础。目前, 主流的气动建模方式普遍使用基于偏微分方程的传统物理模型, 而本就复杂的数学模型面对高维且分布不均的气动数据变得更加难以求解。虽然可以将机器学习方法与CFD方法结合[1-2]从而提高计算效率, 但其根本问题在于仍依赖研究人员手工提取数据特征, 因此无法从根本上解决计算效率低下的问题。如要根本解决问题, 就必须自动学习样本中的隐含特征, 即利用深度学习方法。

早在1993年Dennis等[3]在气动参数识别问题上成功应用神经网络, William等[4]指出空气动力学与神经网络模型的结合会有极大发展前景。但由于当时计算机性能较低, 这类结合没有得到进一步扩展。但随着近年计算机算力提升, 业内学者已经将深度神经网络应用于翼型气动系数预测[5]、流场特征提取[6]等方面, 从而使深度学习和空气动力学结合的可行性得到了进一步验证。

深度学习中, 神经网络训练需要充分的数据支撑才能得到精度较高的模型, 然而, 在现代科学和工程学中, 空气动力学的数据常常较难获取或者精度不够。由于数据来源的多样性, 由模型计算得到的预测数据质量也参差不齐[7], 而多精度分析的技巧则提供了一种解决方式, 它使得不同精度数据的不同特征在预测时可以被充分利用, 平衡数据之间的优劣势[8-9]。特别地, 低精度数据可以在趋势预测方面为高精度数据量的不足提供有力的支持[10]。

多源数据建模中探究高低精度数据之间的关系尤为重要。诸多方法,如混沌多项式展开[11]、高斯过程回归[12]等,已被大量运用于工程领域。Nhu-Van等[13]在无人作战飞行器系统设计中使用多精度分析构建准确可靠的元模型以提高无人机设计方法的准确性, 同时不会显著增加设计周转时间。但这些方法存在一定的限制, 如只能估计数据之间的线性关系、维度爆炸、计算困难等。而神经网络能很好地解决上述问题。Lu等[14]提出利用神经网络学习双精度与高精度正交分解系数之间的相关性, 以处理多精度数据。Chen等[15]开发了一种多精度图形神经网络, 把低精度的数据直接当作输入特征, 将不同精度的带隙放到卷积神经网络的初始化当中,用于准确预测材料性能。

因此, 考虑到目前空气动力学中传统气动参数建模方法的效率和成本问题, 以及未能充分使用多源数据不同特性的问题, 本文旨在利用深度学习中的复合神经网络, 借助低精度数据辅助高精度数据进行气动参数预测, 并在多个实测飞行数据集上测试, 以验证模型的有效性和泛化性, 以期为飞行器飞行设计或仿真分析等提供有力的数据支撑。

1 空气动力学概述

空气动力学作为当代流体力学的一个分支, 主要研究空气运动的规律以及空气与物体之间的相对运动。传统研究由3种方式构成, 分别是理论分析、实验研究和数值模拟。这3种方法相辅相成, 共同推进着空气动力学的演变。

本文使用的空气动力学参数主要包括3个, 分别是马赫数、迎风角和侧滑角。其中, 马赫数(Ma)为流体力学中的无量纲参数, 用以表示流体流速。马赫数的数值等于通过边界的流体流速与局部声速之比。其公式为

式中:u为通过边界的流体流速;c为局部声速。该公式指出, 马赫数可以理解为流体流速相对于声速的倍数。

迎风角(α), 也称作攻角, 是机翼剖面弦线与气流之间的夹角。在一定可取范围内, 迎风角的数值越大, 飞行器获得的升力也就会越大。但是, 超过一定范围, 当迎风角的数值过大时, 飞行器将会失速, 反而失去升力。

侧滑角(β), 是飞行器飞行速度矢量与其纵向对称平面之间的夹角。侧滑角和迎风角一样, 是确定飞行器飞行姿态的重要参数。

2 研究方法

2.1 深度神经网络

深度神经网络(deep neural network)的神经网络层可以分为: 输入层、隐藏层和输出层。一般第一层是输入层, 最后一层是输出层, 而中间的层数都是隐藏层。层与层之间是全连接的, 即第i层的任意一个神经元一定与第i+1层的任意一个神经元相连。

隐层的第h个神经元输入可以表示为

式中:bh为偏置系数;n为前一层神经元的总个数, 再将一个激活函数作用在输入上, 即

利用反向传播算法训练上述神经网络, 找到最适合一个数据集分类的各个神经元之间连接的权重。训练的思路是梯度下降算法, 首先定义一个损失函数, 朝着损失函数下降最快的方向也就是梯度方向去调整权重系数, 损失函数可以选为均方误差

式中:为神经网络的输出值;yj为真实值。

最后根据梯度下降规则更新权重whj

2.1.1 激活函数的选择

激活函数作为非线性函数是神经网络上层输出和下层输入之间函数关系的桥梁。引入激活函数, 能够显著提高神经网络的表达能力和预测能力。它能够使神经网络的输入不再局限于线性组合的空间, 逼近任何的函数。激活函数有许多种常用的种类, 根据不同的场合变化。

Sigmoid函数取值范围为(0, 1), 其公式为

其优点在于平滑、易求导, 但函数计算量大, 很容易出现梯度消失的情况。此外, 它的输出不是0均值, 这会导致后一层的神经元将上一层输出的非0均值的信号作为输入, 随着网络的加深, 会改变数据的原始分布。

Tanh函数和Sigmoid函数相似, 都属于饱和激活函数, 区别在于输出值范围由(0, 1)变为了(-1, 1)。其公式为

相比Sigmoid函数, Tanh函数解决了不是0均值的输出问题,但梯度消失仍没有解决。

ReLU函数是比较简单的函数, 其公式为

ReLU的有效导数是常数1, 解决了深层网络中出现的梯度消失问题, 收敛速度也变快, 使得深层网络可训练。但是ReLU强制将x<0部分的输出置为0, 可能会导致模型无法学习到有效特征。

2.1.2 隐藏层层数及隐藏节点数

本文采用复合神经网络对多源气动数据中隐藏的非线性关系进行探索。在神经网络中, 影响其模型拟合能力的因素, 除激活函数和损失函数之外, 另一个关键点是它的架构。大多数神经网络架构是链式结构的, 在这些链式架构中, 主要考虑是选择网络的深度和每一层的宽度。

这2个超参数通常由数据数量及问题复杂程度决定。从历史及实验经验可知, 若隐藏层层数及隐藏层节点太少, 那么神经网络的训练会出现欠拟合的状况, 导致数据中隐藏的一些信息未能充分提取。若隐藏层层数及隐藏层节点太多, 神经网络的训练会出现过拟合或者梯度消失的问题。对于超参数如何达到最优效果, 目前一般的方法是先根据历史经验以及先人研究, 再根据数据及模型的特点进行调参, 并最后通过实验测试对比,观测在验证集上的误差。模型应尽可能简单以达到优化模型参数的目的。

2.2 复合神经网络结构

在多精度数据的建模过程中, 最关键的部分在于探究低精度和高精度数据之间的相关性。Meng等[16]提出这种相关关系可以被描述为

式中:α∈[0, 1], yHyL分别代表高精度和低精度数据; F代表了一种映射关系, 表示高精度数据xH和低精度数据经过神经网络预测后的输出值yL共同作为输入变量, 映射到高精度数据yH的关系。F被分解为了两部分, 第一部分Fl是线性关系项, 第二部分Fnl是非线性项。α是一个新的超参数。它的确定是基于给出的特定数据集, 从而构建高低精度数据之间的相关性。α越高, 说明高低精度数据之间的线性关系就越强。复合全连接神经网络的完整结构如图 1所示。

该网络结构由3个全连接神经网络组成。第一个神经网络NL(xL, θ)用来训练低精度数据, 第二及第三个神经网络NHi(x, yL), i=1, 2用于探索高低精度数据之间的相关性。其中, NH1被用于近似计算线性关系, 而NH2被用于近似计算非线性关系。XL, 1XL, n分别表示第一个和第n个低精度数据, XH, 1XH, m分别表示第一个和第m个高精度数据。θ是复合神经网络中未知的超参数, 可以通过最小化以下损失函数来得到

式中,yL*yH*表示神经网络NLNHi的输出值。这里需要注意的是, 在NH1中并不需要使用激活函数, 因为它是用来估计F中的线性部分的。

thumbnail 图1

复合神经网络结构图

3 实例分析

3.1 数据来源

本文用CFD生成的低精度数据辅助高精度数据进行气动力参数的建模预测。

3.1.1 低精度数据

建立输入参数为马赫数、迎风角、侧滑角, 输出为气动轴向力系数Ca、法向力系数Cn、横向力系数Cz的CFD数据集, 即得到本文中使用的低精度数据集。样本计算状态取值如表 1所示。

样本的计算状态遍历了表 1中列举的输入条件下的所有计算状态, 低精度数据样本总数为174 267(51×51×67)。

表1

CFD计算状态取值

3.1.2 高精度数据

高精度实测飞行气动力数据包含5组, 编号分别为A, B, C, D, E。输入输出参数与低精度数据相同。几组飞行试验随着时间的马赫数变化如图 2所示。本文将在这5组数据集上进行模型的训练与验证, 以证明模型的有效性和泛化性。

thumbnail 图2

不同飞行试验下马赫数随时间变化

3.2 模型搭建及实验过程

由于气动数据本身的特点, 参数输入和输出之间存在着极强的非线性关系, 因此, 它们之间的相关关系可以被简化描述为

本文中, 该损失函数用Adam优化算法进行优化。同时, 为了使网络中信息更好地流动, 每一层输出的方差应该尽量相等, 因此参数使用Xavier初始化。考虑到数据集中存在负值, 所以使用双曲正切函数作为激活函数。模型架构方面, 通过将数据集划分的验证集确定超参数, NL的网络层数为5, 隐藏神经元数量为128, NH的网络层数为1, 隐藏神经元数量为16。

具体的实验过程可以概括为:

1) 给定低精度数据{xi, yi}(i=1, 2, …, N1), 训练一个低精度的神经网络, 记作NL

2) 同时, 根据给定的高精度实测飞行试验数据集{xi, yi}(i=N1+1, N1+2, …, N1+Nh), 训练一个高精度的神经网络, 记作NH

3) 利用低精度数据辅助高精度数据的预测, 给定{xi}(i=N1+1, N1+2, …, N1+Nh), 令zi=NL(xi), zi为低精度网络输出的辅助结果。然后将{xi, zi}(i=N1+1, N1+2, …, N1+Nh)作为输入变量, {yi}(i=N1+1, N1+2, …, N1+Nh)作为标签, 训练一个新的神经网络, 记作NL-H。从而完成复合网络的构建。

3.3 实验结果与分析

按照上述复合神经网络实验过程, 训练神经网络, 分别得到使用单一网络训练和复合神经网络训练的结果。

首先仅对高精度的飞行器实测气动力数据(数据集E)进行单独训练, 建立一般神经网络, 预测的气动轴向力系数Ca、法向力系数Cn、横向力系数Cz结果如图 3所示。然后使用本文中提出的复合神经网络, 利用低精度数据辅助高精度数据进行训练, 得到在测试集上三分量输出结果如图 4所示。

由神经网络的训练预测值(绿点)与真值(蓝线)对比可以看出, 高精度数据数量稀少, 但得益于精度很高, 训练的预测值也在真实值附近徘徊, 但受限于数量稀少, 不能对神经网络进行更好地学习, 难免存在预测点偏离实际值较远的情况。而复合神经网络融合了高低精度2类数据的特点, 利用低精度数据辅助高精度数据进行训练, 对比可以看出, 其预测的气动数据值较只使用高精度的神经网络更为准确, 偏离真值的预测数据更少, 验证了前述低精度数据可以在趋势预测方面为高精度数据的不足提供有力的支持。

为进一步检验模型的准确度和泛化性能, 在另外4个非训练数据集上测试上述2种模型, 将相同飞行状态下的预测输出和实测飞行数据进行对比。同时, 为增强实验说服力, 加入现有研究使用较多的卷积神经网络[5-6, 17]进行结果对比。卷积神经网络使用的激活函数仍均为双曲正切, 使用Adam优化算法。

具体对比结果如图 5所示。红色实线为实际飞行数据, 蓝色虚线为复合神经网络生成结果, 绿色点划线为使用单一神经网络预测结果, 橙色点划线为使用卷积神经网络的预测结果。由图可以看出本文建立的复合神经网络模型在不同状态的飞行器参数预测上均有较好表现, 可以使得气动参数的预测结果更加接近实际值。

同时, 使用均方误差和平均绝对值误差作为模型精度的标准, 结果如表 2所示。从表中可以看出, 复合神经网络的训练效果均优于单精度数据训练的神经网络模型, 与卷积神经网络的精度不相上下, 但对比上述模型预测结果, 复合神经网络能更加接近真实值, 说明本文建立的复合神经网络能够较好利用低精度数据对高精度数据的辅助作用, 建立相对精度较高的气动参数预测模型。

thumbnail 图3

单一神经网络训练预测值与真值对比

thumbnail 图4

复合神经网络训练预测值与真值对比

thumbnail 图5

不同数据集上的模型验证

表2

单精度与复合神经网络训练效果

4 结论

本文通过神经网络自动学习样本数据中的隐含特征, 利用低精度数据辅助高精度数据进行气动参数的预测, 并在多个实测飞行数据集上测试, 以验证模型的有效性和泛化性, 提升模型准确度。本文主要得出以下结论:

1) 利用单精度数据建立独立神经网络, 预测不同环境下气动数据参数的输出值。结果显示, 仅使用高精度数据进行预测时, 虽然数据质量较高, 但受限于稀少的数量来源, 会产生较多的偏离值。

2) 根据多源数据的特性, 建立复合神经网络模型, 与使用单精度数据的神经网络建模结果相比, 结果显示, 使用复合神经网络对高精度数据的输入参数进行预测时, 结果精度和效率均有一定程度提升, 证明了低精度数据对高精度数据的辅助作用。

3) 在多个不同数据集上进行模型性能检验, 并与现有研究中使用较多的卷积神经网络进行结果对比, 再次得出复合神经网络在气动参数建模方面有较好的表现, 且泛化性能良好。

未来研究可以尝试使用不同种类的网络结构作为复合网络模型的组成部分, 更加充分发挥多源数据的特质, 实现数据效益的最大化。

References

  1. IOANNIS G T, DIMITRIS G, EURIPIDIS G. Solving differential equations with constructed neural networks[J]. Neurocomputing, 2009, 72(10/11/12): 2385–2391 [Google Scholar]
  2. MALL S, CHAKRAVERTY S. Comparison of artificial neural network architecture in solving ordinary differential equations[J]. Advances in Artificial Neural Systems, 2013, 2013: 12 [Google Scholar]
  3. DENNIS J L, ROBERT F S. Identification of aerodynamic coefficients using computational neural networks[J]. Journal of Guidance, Control, and Dynamics, 1993, 16(6): 1018–1025. [Article] [Google Scholar]
  4. WILLIAM E F, SCOTT J S. Neural networks: applications and opportunities in aeronautics[J]. Progress in Aerospace Sciences, 1996, 32(5): 433–456. [Article] [Google Scholar]
  5. CHEN Hai, QIAN Weiqi, HE Lei. Aerodynamic coefficient prediction of airfoils based on deep learning[J]. Acta Aerodynamica Sinica, 2018, 36(2): 294–299. [Article] (in Chinese) [Google Scholar]
  6. LI Yi, Research on visualization method of flow field feature based on convolution neural network[D]. Harbin: Harbin Engineering University, 2018 (in Chinese) [Google Scholar]
  7. MENG Xuhui, HESSAM B, GEORGE E K. Multi-fidelity bayesian neural networks: algorithms and applications[J]. Journal of Computational Physics, 2021, 438: 110361. [Article] [Google Scholar]
  8. ALEXANDER I J F, ANDRÁS S, ANDY J K. Multi-fidelity optimization via surrogate modelling[J]. Proceedings of the Royal Society A Mathematical Physical & Engineering Sciences, 2007, 463(2088): 3251–3269 [Google Scholar]
  9. MAZIAR R, GEORGE K. Deep multi-fidelity Gaussian processes[J]. (2016-04-26)[2023-01-05]. [Article] [Google Scholar]
  10. PERDIKARIS P, RAISSI M, DAMIANOU A, et al. 2017 Nonlinear information fusion algorithms for data-efficient multi-fidelity modelling[J]. Proceedings of the Royal Society, Mathematical, Physical and Engineering Sciences, 2017, 473(2198): 20160751. [Article] [Google Scholar]
  11. ELDRED M. Recent advances in non-intrusive polynomial chaos and stochastic collocation methods for uncertainty analysis and design[C]//50th AIAA/ASME/ASCE/AHS/ASC Structures, Structural Dynamics, and Materials Conference, 2009 [Google Scholar]
  12. PANG Guofei, LIU Yang, GEORGE E, et al. Neural-net-induced gaussian process regression for function approximation and PDE solution[J]. Journal of Computational Physics, 2019(384): 270–288 [Google Scholar]
  13. NHU-VAN N, SEOK-MIN C, WAN-SUB K, et al. Multidisciplinary unmanned combat air vehicle system design using multi-fidelity model[J]. Aerospace Science and Technology, 2013, 26(1): 200–210. [Article] [Google Scholar]
  14. LU Chuan, ZHU Xueyu. Bifidelity data-assisted neural networks in nonintrusive reduced-order modeling[J]. Science of Computer Programming, 2021, 87(1): 1–30 [Google Scholar]
  15. CHEN Chi, ZUO Yunxing, YE Weike, et al. Learning properties of ordered and disordered materials from multi-fidelity data[J]. Nature Computational Science, 2021, 1(1): 46–53 [Google Scholar]
  16. MENG Xuhui, GEORGE E K. A composite neural network that learns from multi-fidelity data: application to function approximation and inverse PDE problems[J]. Journal of Computational Physics, 2020(401): 109020 [Google Scholar]
  17. LYU Zhaoyang, NIE Xueyuan, ZHAO Aobo. Prediction of wing aerodynamic coefficient based on CNN[J]. Journal of Beijing University of Aeronautics and Astronautics, 2023, 49(3): 674–680. [Article] (in Chinese) [Google Scholar]

All Tables

表1

CFD计算状态取值

表2

单精度与复合神经网络训练效果

All Figures

thumbnail 图1

复合神经网络结构图

In the text
thumbnail 图2

不同飞行试验下马赫数随时间变化

In the text
thumbnail 图3

单一神经网络训练预测值与真值对比

In the text
thumbnail 图4

复合神经网络训练预测值与真值对比

In the text
thumbnail 图5

不同数据集上的模型验证

In the text

Current usage metrics show cumulative count of Article Views (full-text article views including HTML views, PDF and ePub downloads, according to the available data) and Abstracts Views on Vision4Press platform.

Data correspond to usage on the plateform after 2015. The current usage metrics is available 48-96 hours after online publication and is updated daily on week days.

Initial download of the metrics may take a while.