Open Access
Issue
JNWPU
Volume 43, Number 5, October 2025
Page(s) 1014 - 1021
DOI https://doi.org/10.1051/jnwpu/20254351014
Published online 05 December 2025

© 2025 Journal of Northwestern Polytechnical University. All rights reserved.

Licence Creative CommonsThis is an Open Access article distributed under the terms of the Creative Commons Attribution License (https://creativecommons.org/licenses/by/4.0), which permits unrestricted use, distribution, and reproduction in any medium, provided the original work is properly cited.

水下潜航器声辐射、声散射特性一直是水声工程等领域研究的重要课题,尤其是低频段的声学特性更是工程应用中的重点。户外大型天然水域外场试验特别是海洋环境中的声学测量成本高,同时易受到海况影响。在人工水池中进行水下声学试验和测量操作方便、可重复、成本低、环境因素少,已经成为成熟且重要的测量手段。当前关于人工水池声学测量技术和方法主要分为2个研究方向,一类是非消声水池混响法[1-4],另一类是消声水池自由场法[5]。前者因需满足弥散场条件其在低频声场的应用被限制,后者受限于场地大小和消声材料性能,只有频率高于截止频率才满足自由场条件,低频时声波在边界发生反射,进而产生混响,声场发生畸变,严重影响自由场测量的准确程度。因此,解决人工水池低频声场预报问题,突破水池测试环境限制,并利用新方法弥补自由场边界条件不足,是扩展人工消声水池工程应用前景的关键技术难题。

在人工消声水池中使用水听器测量得到的水下结构物频域声学特性的频响曲线可以视为具备“时序”的序列。所谓“时序”是指结构物在频域上表现出的声学连续状态,该状态与方向无关,故由低频到高频或由高频到低频均可。序列的特征为水下结构物声学特性,以声辐射为例,即在特定物理方程和边界条件下结构物受激振动时所产生的声学响应特性。因此,在机器学习等人工智能领域蓬勃发展的背景下,此类数据问题可以采用深度学习中的时间序列预测算法,进行由高频到低频的声学响应训练及预测,实现在低频段声学响应的预测。常用的时间序列预测模型有自回归积分滑动平均模型(ARIMA)[6-7]、三重指数平滑模型(Holt-Winters)[8-9]、向量自回归模型(VAR)[10-11]、长短期记忆模型(LSTM)等,其中,LSTM模型及其改进模型在序列特征识别和预测周期上具有独特的优势[12-14]。

本研究首先对国内主要科研机构和高校的消声水池参数进行了搜集与整理。现有公开资料表明,国内消声水池尺寸通常在数十米量级,截止频率多集中在2 000~3 000 Hz,部分机构消声水池截止频率在1 000~1 500 Hz,工作频率范围内的吸声系数普遍可达0.98以上,具有优良的吸声性能。然而,在截止频率以下的低频段,理想自由场条件在消声水池中难以实现,这给低频水声测量与流噪声试验等带来一定限制。

因此本文提出并建立了一种融合自注意力机制(attention mechanism, AM)的卷积的长短期记忆网络(convolutional long short-term memory, cLSTM),探究消声水池中结构物低频声场推演。本文将圆柱壳作为水下结构物的典型进行分析,首先采用数值模拟方法获得水下圆柱壳体结构声辐射数据集,以保证所获取的数据集中声压数据的准确性,其次利用cLSTM-AM模型进行训练,完成参数调整和优化,并与LSTM-AM模型和cLSTM模型进行对比评估。同样地,采用数值模拟方法获得水下圆柱壳体结构声散射数据集,并利用cLSTM-AM模型进行训练。最后在消声水池中进行声散射试验,归一化处理试验所得散射声压级并与仿真和训练所得声压级进行对比。

1 cLSTM-AM低频推演模型

1.1 算法原理

本研究所提出的cLSTM-AM低频推演模型是基于循环神经网络(recurrent neural networks, RNN)的一种变体。其中实现低频推演功能主要依赖于LSTM模型,融合卷积层和注意力机制是对LSTM模型的进一步改进,以期提高对序列中特征的关注和理解。

LSTM模型运用记忆单元、输入门、输出门和遗忘门等组件捕捉时间序列中的长期依赖关系,在每个时间步利用输入数据和上一时刻的记忆状态计算新的记忆状态,并根据新的记忆状态和上一时刻的输出计算当前时刻的输出,如图 1所示。

3个控制门和单元信息更新的原理,即LSTM单元在时刻t的计算过程为[15-16]

(1)

(2)

(3)

(4)

(5)

(6)

式中: Wf, Wi, Wo, Wc分别为遗忘门、输入门、输出门和候选单元状态的权重矩阵; bf, bi, bo, bc分别为遗忘门、输入门、输出门和候选单元状态的偏置项; ft, it, t, ot分别对应当前时刻控制遗忘、输入、单元状态更新、输出信息的比例系数; Xt, ht, Ct分别表示当前时刻的输入、输出和单元状态; ht-1, Ct-1分别表示上一时刻的输出和单元状态; 表示矩阵元素乘积; σ和tanh为激活函数。

在LSTM模型中加入卷积层可以在序列中提取局部特征, 帮助模型更加全面地理解序列数据, 有助于提高模型的预测准确性[17]。相比于传统LSTM模型, 注意力机制可以使模型更加关注序列中的重要特征, 解决所有输入被赋予相等权重的问题[18]。

thumbnail 图1

LSTM模型结构

1.2 模型框架

在cLSTM-AM低频推演模型框架中, 除了在—init方法中定义模型的参数和架构外, 在forward中各组件及其操作按顺序为:

组件1   在卷积层中, 对输入的张量形式的声压频响序列进行重塑, 以适应卷积层输入要求。卷积层对重塑后的张量进行卷积运算, 并使用激活函数和dropout等操作;

组件2   在LSTM-AM中, 从卷积层输出的张量经过排列, 由带有注意力机制的LSTM处理。LSTM将卷积层的隐藏状态作为输入。然后, 迭代输入序列, 并更新其隐藏状态。每个时间步的隐藏状态存储在out张量中。注意力机制通过线性层和激活函数应用于out张量。注意力权重与out张量逐元素相乘, 以强调重要特征。最后, 对加权张量沿时间维度求和, 并更新LSTM最后一个隐藏状态;

组件3   将LSTM最后一个隐藏状态通过线性层生成预测输出张量, 使用dropout操作;

组件4   在自回归层中, 从输入张量中提取最后部分时间步进行重塑, 通过线性层生成分量逐元素添加到输出张量中, 使用dropout操作。

最终, 得到cLSTM-AM低频推演模型, 框架示意图如图 2所示。

thumbnail 图2

cLSTM-AM推演模型

1.3 评价指标

为了全面且准确地评估低频推演模型的性能, 采用多个评价指标对低频推演声压结果进行综合评估。低频推演模型属于回归类模型, 故选取平均绝对误差EMA、均方根误差ERMS、皮尔逊相关系数rP作为代表性评价指标。计算公式分别为

(7)

(8)

(9)

式中: N为数据组数; 为声压预测值; pn为声压真实值; 为声压预测值均值; 为声压真实值均值。

在3个评价指标中,EMAERMS用来评估低频推演声压结果的准确性和拟合程度,rP用来衡量推演声压与真实声压的相似度和线性相关程度。

2 声辐射模型设置与评估验证

2.1 仿真模型设置与数据准备

以圆柱壳为典型研究对象,在圆柱壳声辐射数值模拟中,将计算频段设置为20~10 000 Hz,步长为2.5 Hz,可获得3 993组数据,将此声压数据集从低频到高频进行排列。

对于该中小型数据集,将稍大量的数据用于训练,留出较小量数据做验证和预测,能够在确保模型学习充分、保证训练效果的基础上,提供足够的样本进行超参数微调和模型性能评估,更有助于防止过拟合,并提高评估结果的代表性和稳定性。因此按照60%为训练数据集,20%为验证数据集,20%为预测数据集来划分数据,得到预测集所处频段约为20~2 000 Hz,适用于预测消声水池低频段声辐射特性。

数值模型采用有限元仿真软件COMSOL Multiphysics进行建模和计算,计算模型如图 3所示。

水池长2 m、宽1 m、高0.9 m。水池中圆柱壳长0.4 m、半径0.05 m、壁厚0.001 m,两端封闭,内部无子结构,两端固支,位于水池几何中心。圆柱壳材料属性:弹性模量2.1×1011 Pa、密度7 850 kg/m3、泊松比0.3。沿圆柱壳顶端轴向长度施加线激励,激励幅值为1 N/m。水域6个面使用完美匹配层和软声场边界消除声波反射。依据计算频率自动调整网格大小,随着频率变化,网格最大尺寸始终不大于计算频率对应波长的六分之一。壳体结构和水域之间采用声-结构相互作用的多物理场耦合。采用探针获取测点在各个计算频率的声压值,测点位于圆柱壳结构几何中心正上方0.2 m处。

考虑到实际消声水池试验中存在的水听器、放大器等系统噪声以及水下背景噪声等因素,在数值模拟计算结果基础上,向仿真声压数据中增加水下噪声。本文选取前期在消声水池中试验测得的噪声数据,声压级曲线如图 4所示。

在数据集中加入上述噪声不仅可以更真实地模拟试验条件下获得的声压数据,还会对推演模型产生以下影响:

1) 增加推演模型的鲁棒性,更好地模拟现实水池试验测量中的不确定性和变化,使得推演模型在处理真实数据时更具有适应性;

2) 加入噪声可以使得推演模型更好地理解声压数据中的模式和规律,还能够识别和学习数据集中的一些未知模式,从而提高推演模型的泛化能力;

3) 加入噪声可以减少推演模型的过拟合问题,使推演模型更强调数据中的一般特征,而不是过分关注数据集中的噪声或异常值。综上分析可知,混合噪声数据后,数据集更符合消声水池试验的实际情况,也有利于提高模型预测精度。

thumbnail 图3

圆柱壳声辐射仿真模型示意图

thumbnail 图4

背景噪声声压级曲线

2.2 低频推演模型性能评估

本研究提出的cLSTM-AM低频推演模型可调试的参数包括输入窗口大小、批次大小、卷积层的核大小、预测步数、隐藏单元数目和自回归窗口大小等。通过对cLSTM-AM低频推演模型进一步进行参数调整,得到最佳参数组合的模型。

参数调试配置为系统(Windows 11)、CPU(13th Gen Intel(R) Core(TM) i7-13700K)、内存(31.8GB)、编程语言(Python3.9)、深度学习框架(Pytorch2.4)。在参数调试过程中,通过设置随机失活率(dropout)防止可能出现的过拟合现象,dropout设为0.2,学习率为1×10-3

采用参数化方法进行超参数微调,在对某一参数进行调整时,综合其对验证集和预测集的影响,选择其中较好的值,确定后再进行下一个参数的调整。本次超参数微调选择的初始参数为:窗口大小7,批次大小64,卷积层核大小2,预测步数2,隐藏层单元数目64,自回归窗口大小3。最终得到cLSTM-AM低频推演模型最佳参数配置:窗口大小9,批次大小256,卷积层核大小3,预测步数5,隐藏层单元数目32,自回归窗口大小2。参数微调过程中验证集和预测集的评估指标值如表 1~2所示。

表 1~2可知:本研究提出的cLSTM-AM低频推演模型在频率20~2 000 Hz范围的预测集上EMAERMS值为0.019和0.035,验证了模型推演低频段声压频响的精度,皮尔逊相关系数为0.933,证明在声压峰值等关键数据特征预测上的线性相关度很高。

cLSTM-AM推演模型在整个数据集上的表现如图 5所示,可以看出该推演模型在整个频段上表现良好,具体表现在声压峰值处对幅值学习的准确率较高,同时,反映低频段的预测集在趋势预测、峰值特征识别等方面表现优秀。

为了突出cLSTM-AM低频推演模型性能,以及引入卷积层和注意力机制对LSTM模型的影响,对比无卷积层的LSTM-AM模型和无注意力机制的cLSTM模型,考察3个算法模型在预测集上的误差和相关程度。

表 3所示,cLSTM-AM的平均绝对误差和均方根误差值最小,在预测集上的准确率明显高于无卷积层模型和无注意力机制模型,在线性相关性上,3种模型均表现良好。评估结果说明得益于卷积层和注意力机制,cLSTM-AM低频推演模型表现出更好的预测性能。

表1

验证集上评估指标值

表2

预测集上评估指标值

thumbnail 图5

cLSTM-AM推演模型整体性能

表3

不同推演模型评估指标值

3 声散射模型设置与评估验证

3.1 仿真模型设置与数据准备

在圆柱壳体声散射仿真模拟中,将计算频段设置为500~5 000 Hz,步长为1 Hz,可获得4 501组数据,将此声压数据集从低频到高频进行排列。同样按照训练集、验证集和预测集60%, 20%, 20%的比例来划分数据,训练集频段为2 300~5 000 Hz,验证集频段为1 400~2 300 Hz,预测集频段为500~1 400 Hz,适用于预测消声水池低频段声散射特性。

运用仿真软件COMSOL Multiphysics的边界元模块进行建模和计算,圆柱壳长1.2 m,半径0.11 m,壁厚0.003 m,内部无子结构,两端固支。圆柱壳材料属性:弹性模量2.1×1011 Pa,密度7 850 kg/m3,泊松比0.3。在无限空域中,垂直于圆柱壳轴向设置一个平面波背景压力场,压力幅值为1 Pa。壳体结构和水域之间采用声-结构边界的多物理场耦合。采用三维截点获取测点在各个计算频率下的声压值,测点距离圆柱壳结构几何中心3 m,如图 6所示。

同样地,需要考虑水下背景噪声,因此在数值模拟计算结果基础上,增加声散射试验测得的背景噪声,背景噪声声压级曲线如图 7所示。

thumbnail 图6

圆柱壳声散射仿真模型示意图

thumbnail 图7

背景噪声声压级曲线

3.2 低频推演模型试验验证

由2.2节得到,cLSTM-AM低频推演模型具有更好的预测性能,因此用该模型进行圆柱壳声散射声压级数据训练和预测。通过对cLSTM-AM低频推演模型的参数调整,得到最佳参数组合的模型,其最佳参数配置为:窗口大小9,批次大小256,卷积层核大小3,预测步数2,隐藏层单元数目32,自回归窗口大小2。模型在500~1 400 Hz测试集上平均绝对误差和均方根误差值为0.008和0.012,皮尔逊相关系数为0.993,证明模型推演低频段声压频响的精度良好,在声压峰值等关键数据特征预测上的线性相关度很高。为了验证cLSTM-AM低频推演模型训练数据的准确性和有效性,在中国船舶重工集团第710研究所的消声水池中进行了圆柱壳声散射试验,消声水池长40 m、宽15 m、水深10 m,截止频率为1 500 Hz,如图 8所示。

试验示意图如图 9所示,图中圆柱壳体半径R为0.11 m,水听器2距离圆柱壳体中心距离L为3 m。水听器1测换能器发出平面声波的声压级,水听器2测圆柱壳的散射声压级。

将试验所得的散射声压级归一化处理,并与仿真和模型训练所得声压级进行对比,如图 10所示。得到在截止频率1 500 Hz以上,三者对应良好;在1 500 Hz以下,由于水池存在严重的低频混响,试验获得的声压级明显高于模型预测所得声压级,而模型预测值与仿真值对应良好,符合前文所述的由于水池测试环境限制导致的试验值不准确。因此cLSTM-AM低频推演模型能够很好地预测圆柱壳在低频段的声散射声压级。

thumbnail 图8

圆柱壳声散射试验

thumbnail 图9

试验示意图

thumbnail 图10

cLSTM-AM推演模型整体性能及试验验证

4 结论

针对消声水池声学试验在低频段消声效果受限、测量精度低的问题,以圆柱壳结构声辐射和声散射为研究对象,提出了一种适用于低频段推演的融合自注意机制和卷积层的长短期记忆网络模型cLSTM-AM。

在20~2 000 Hz低频段,声辐射声压频响预测结果表明:相较于传统的简单时间序列预测模型,所提出的cLSTM-AM推演模型在数值模拟加背景噪声所得到的数据集上,优于无卷积层的LSTM-AM模型和无注意力机制的cLSTM模型,具有较高的预测精度和较好的泛化能力。通过圆柱壳声散射试验得到水池截止频率1 500 Hz以上,模型训练得到的散射声压级与试验结果对应较好,而在500~1 500 Hz,模型预测结果基本小于试验结果,能够消除试验低频混响噪声影响,验证了所提出的cLSTM-AM模型的有效性,为低频段人工水池试验测试研究提供了新的验证手段和方法参考。

References

  1. SHANG Dajing, TANG Rui, LI Qi, et al. Measurement of radiated sound power from a complex underwater sound source in a non-anechoic pool based on spatial averaging[J]. Journal of Sound & Vibration, 2020, 468: 115071 [Google Scholar]
  2. ZHANG Yiming, TANG Rui, LI Qi, et al. The low-frequency sound power measuring technique for an underwater source in a non-anechoic tank[J]. Measurement Science & Technology, 2018, 29(3): 035101 [Google Scholar]
  3. YU Xinyue. Research on measurement method of characteristics of transient underwater sound sources in non-free field[D]. Harbin: Harbin Engineering University, 2020 (in Chinese) [Google Scholar]
  4. XU Hongzhe, LI Qi, TANG Rui, et al. Method for measuring the low-frequency sound power from a complex sound source based on sound-field correction in a non-anechoic tank[J]. Chinese Physics B, 2023, 32(5): 504–519 [Google Scholar]
  5. ROBINSON S P, HARRIS P M, FORD B, et al. CCAUV W-K2 final report-key comparison CCAUV W-K2: calibration of hydrophones in the frequency range from 250 Hz to 500 kHz[J]. Metrologia, 2022, 59(1): 09003 [Google Scholar]
  6. LI Yitong, WU Kai, LIU Jing. Self-paced ARIMA for robust time series prediction[J]. Knowledge-Based Systems, 2023, 269: 110489. [Article] [Google Scholar]
  7. ZHANG Xianqi, WU Xilong, ZHU Guoyu, et al. A seasonal ARIMA model based on the gravitational search algorithm(GSA) for runoff prediction[J]. Water Supply, 2022, 22(8): 6959–6977. [Article] [Google Scholar]
  8. ALEMU A B, PARAKASH RAJU U J, SEID A M, et al. Comparative study of seasonal autoregressive integrated moving average and Holt-Winters modeling for forecasting monthly ground-level ozone[J]. AIP Advances, 2023, 13(3): 035303. [Article] [Google Scholar]
  9. MOHAN M, KISHORE RAJA P C, VELMURUGAN P, et al. Holt-Winters algorithm to predict the stock value using recurrent neural network[J]. Intelligent Automation & Soft Computing, 2022, 35(1): 1151–1163 [Google Scholar]
  10. OUMA Y O, MOALAFHI D B, ANDERSON G, et al. Dam water level prediction using vector autoregression, random forest regression and MLP-ANN models based on land-use and climate factors[J]. Sustainability, 2022, 14(22): 14934. [Article] [Google Scholar]
  11. IYER S, MAHAJAN A. Predicting total electron content in ionosphere using vector autoregression model during geomagnetic storm[J]. Journal of Applied Geodesy, 2021, 15(4): 279–291. [Article] [Google Scholar]
  12. VO T. An integrated dual attention with convolutional LSTM for short-term temperature forecasting[J]. Cybernetics & Systems, 2024, 55(2): 511–533 [Google Scholar]
  13. HUANG Xiaohui, TANG Jie, YANG Xiaofei, et al. A time-dependent attention convolutional LSTM method for traffic flow prediction[J]. Applied Intelligence, 2022, 52(15): 17371–17386. [Article] [Google Scholar]
  14. LUO Jiahang, ZHANG Xu. Convolutional neural network based on attention mechanism and Bi-LSTM for bearing remaining life prediction[J]. Applied Intelligence, 2022, 52(1): 1076–1091. [Article] [Google Scholar]
  15. QI Yongsheng, WANG Xinhua, YANG Xuyun, et al. Research on acoustic methods for buried PE pipeline detection based on LSTM neural networks[J]. Measurement Science and Technology, 2024, 35(9): 096001. [Article] [Google Scholar]
  16. DU Jinbo, ZENG Jie, WANG Han, et al. Using acoustic emission technique for structural health monitoring of laminate composite: a novel CNN-LSTM framework[J]. Engineering Fracture Mechanics, 2024, 309: 110447. [Article] [Google Scholar]
  17. XIONG Shanwei, ZHOU Li, DAI Yiyang, et al. Attention-based long short-term memory fully convolutional network for chemical process fault diagnosis[J]. Chinese Journal of Chemical Engineering, 2023, 56(4): 1–14 [Google Scholar]
  18. XU Chengfeng, FENG Jian, ZHAO Pengpeng, et al. Long- and short-term self-attention network for sequential recommendation[J]. Neurocomputing, 2021, 423: 580–589. [Article] [Google Scholar]

All Tables

表1

验证集上评估指标值

表2

预测集上评估指标值

表3

不同推演模型评估指标值

All Figures

thumbnail 图1

LSTM模型结构

In the text
thumbnail 图2

cLSTM-AM推演模型

In the text
thumbnail 图3

圆柱壳声辐射仿真模型示意图

In the text
thumbnail 图4

背景噪声声压级曲线

In the text
thumbnail 图5

cLSTM-AM推演模型整体性能

In the text
thumbnail 图6

圆柱壳声散射仿真模型示意图

In the text
thumbnail 图7

背景噪声声压级曲线

In the text
thumbnail 图8

圆柱壳声散射试验

In the text
thumbnail 图9

试验示意图

In the text
thumbnail 图10

cLSTM-AM推演模型整体性能及试验验证

In the text

Current usage metrics show cumulative count of Article Views (full-text article views including HTML views, PDF and ePub downloads, according to the available data) and Abstracts Views on Vision4Press platform.

Data correspond to usage on the plateform after 2015. The current usage metrics is available 48-96 hours after online publication and is updated daily on week days.

Initial download of the metrics may take a while.