一种基于双通道自监督声特征学习的水下目标识别方法

    公开(公告)号:CN116612376A

    公开(公告)日:2023-08-18

    申请号:CN202310512402.9

    申请日:2023-05-08

    Abstract: 本发明为了深入研究对比式自监督特征学习方法提升水下目标识别任务性能,提出一种基于双通道自监督声特征学习的水下目标识别方法。包括如下步骤:(1)提出构建双通道自注意力音频编码器模型;(2)提出构建动态正样本存储的双通道自注意力音频编码器模型;(3)完成基于动态正样本存储的双通道自注意力音频编码器模型的水下目标识别方法,提取动态正样本存储的双通道自注意力音频编码器谱图特征,利用多层感知机模型和多分类逻辑回归模型完成水下目标识别任务。本发明提出的一种基于双通道自监督声特征学习的水下目标识别方法具备良好的识别精度和收敛速度,能够有效的在噪声环境下对水下目标进行识别,表现出较强的鲁棒性。

    一种基于卷积块注意机制的视听双模态语音识别方法

    公开(公告)号:CN112216271B

    公开(公告)日:2022-10-14

    申请号:CN202011080817.6

    申请日:2020-10-11

    Abstract: 本发明提供一种基于卷积块注意机制的视听双模态语音识别方法,包括如下步骤:(1)对视听双模态信息数据集进行预处理;(2)提出构建CBAM‑AV‑LipNet模型;(3)完成基于卷积块注意机制的视听双模态语音识别任务,实现视听双模态语音识别任务。本发明利用提出构建的CBAM‑AV‑LipNet模型对测试集进行特征提取得到深层融合特征向量,对其进行CTC贪婪搜索解码,获得识别文本信息,完成视听双模态语音识别任务。本发明提出的基于卷积块注意机制的视听双模态语音识别方法较传统的语音识别方法和视觉语音识别模型LipNet具有良好的识别性能和收敛速度,同时具有一定的抗噪能力和有效性。

    一种基于声嵌入记忆空间编码器模型的特征对抗增强水下目标识别方法

    公开(公告)号:CN114565828A

    公开(公告)日:2022-05-31

    申请号:CN202210170623.8

    申请日:2022-02-24

    Abstract: 本发明属于水下目标识别技术领域,具体涉及一种基于声嵌入记忆空间编码器模型的特征对抗增强水下目标识别方法。本发明通过构建自监督SAE模型,完成从FBank特征到GBank特征的空间转换重构,学习具有良好声纹特性和抗噪鲁棒性的SAE Spec特征;通过基于AEMU模块的负样本挖掘策略,使用动态队列字典对负样本进行动态更新存储,提高了负样本学习的效率;利用改进的CE Loss函数将AEMU模块与SAE模型结合,构建AEMU‑SAE模型,使特征转换重构和特征负样本学习统一在AEMU‑SAE模型中,保证AEMU‑SAE模型能够在特征对抗增强过程中学习到包含高级语义信息的ASAE Spec特征,将ASAE Spec特征分别作为MLP模型和MLR模型的输入,通过多分类目标识别模型对识别任务进行处理,最终完成水下目标识别。

    一种基于表征增强的特征域优化小样本图像转换方法

    公开(公告)号:CN114565806A

    公开(公告)日:2022-05-31

    申请号:CN202210170641.6

    申请日:2022-02-24

    Abstract: 本发明属于图像处理技术领域,具体涉及一种基于表征增强的特征域优化小样本图像转换方法。本发明通过引入直方图均衡算法和Canny算法先验知识,对图像对比度信息和边缘信息进行增强处理,在此基础上通过基于亚像素卷积的通道注意力机制改善网络特征提取能力,进行图像表征增强,解决图像细微特征不突出的问题。本发明提出基于特征域优化算法的转换机制,通过引入对抗思想自适应划分特征域和内容域,利用源域中多类丰富的图像缩小参数空间,噪声策略的添加使得网络不局限于单一样本的生成,减缓模式崩塌问题;根据源域和目标域的特点,构建重建策略,利用弱化后的循环语义一致性完成小样本图像转换任务,并获得视觉效果更好的转换图像。

    基于深度学习的自适应权值卷积神经网络水下声纳图像分类方法

    公开(公告)号:CN108427958B

    公开(公告)日:2021-06-01

    申请号:CN201810104948.X

    申请日:2018-02-02

    Abstract: 本发明提供的是一种基于深度学习的自适应权值卷积神经网络水下声纳图像分类方法。(1)根据数据集中水下声纳图像的特点,生成深度信念网络DBN二维参数矩阵;(2)自适应调整卷积神经网络CNN滤波器权值矩阵的分布;(3)实现基于深度学习的自适应权值卷积神经网络水下声纳图像分类。本发明提出的基于深度学习的自适应权值卷积神经网络水下声纳图像分类方法,可以解决CNN中滤波器权值初始化的随机问题,避免陷入局部最优,能更好的提高分类正确率,有一定的有效性。

    一种基于类意识领域自适应的水下声纳图像无监督分类方法

    公开(公告)号:CN111444955A

    公开(公告)日:2020-07-24

    申请号:CN202010216387.X

    申请日:2020-03-25

    Abstract: 本发明提供一种基于类意识领域自适应的水下声纳图像无监督分类方法,包括:(1)利用生成对抗网络构建生成数据集;(2)提出基于对抗自编码器的改进方法构建领域自适应的源域;(3)提出基于对抗学习方法构建领域自适应的目标域;(4)训练目标域,在均衡和非均衡两种原生数据集上完成水下声纳图像无监督分类。本发明提出使用CGAN和DCGAN两种GANs来生成图像以构建水下声纳图像生成数据集,并根据标签缺失的情况,将无监督领域自适应方法引入到水下声纳图像的无监督分类中。同时构建均衡和非均衡两种水下声纳图像原生数据集上以验证本发明所提方法的适应性。

    一种基于前视声纳的改进核相关滤波水下目标跟踪方法

    公开(公告)号:CN109308713A

    公开(公告)日:2019-02-05

    申请号:CN201810870281.4

    申请日:2018-08-02

    Abstract: 本发明为了得到更好的前视声纳水下目标跟踪效果,提出了一种基于改进核相关滤波算法的水下目标跟踪方法。主要包括如下步骤:(1)前视声纳图像的预处理;(2)选取动态连续变化尺度的检测基样本,利用滤波器模型检测声纳图像目标的最佳位置;(3)根据峰值旁瓣比自适应更新滤波器模型,在更新过程中,选取动态连续变化的训练基样本来计算不同尺度的滤波器模型,最终实现前视声纳水下目标跟踪。对采集的水下目标原始数据进行实验结果分析,验证提出的基于改进核相关滤波算法对前视声纳水下目标跟踪具有较高的跟踪精度,并且当目标尺度发生变化、目标中途消失又出现等情况仍然具有一定的有效性和适应性。

    一种基于声嵌入记忆空间编码器模型的特征对抗增强水下目标识别方法

    公开(公告)号:CN114565828B

    公开(公告)日:2024-12-13

    申请号:CN202210170623.8

    申请日:2022-02-24

    Abstract: 本发明属于水下目标识别技术领域,具体涉及一种基于声嵌入记忆空间编码器模型的特征对抗增强水下目标识别方法。本发明通过构建自监督SAE模型,完成从FBank特征到GBank特征的空间转换重构,学习具有良好声纹特性和抗噪鲁棒性的SAE Spec特征;通过基于AEMU模块的负样本挖掘策略,使用动态队列字典对负样本进行动态更新存储,提高了负样本学习的效率;利用改进的CE Loss函数将AEMU模块与SAE模型结合,构建AEMU‑SAE模型,使特征转换重构和特征负样本学习统一在AEMU‑SAE模型中,保证AEMU‑SAE模型能够在特征对抗增强过程中学习到包含高级语义信息的ASAE Spec特征,将ASAE Spec特征分别作为MLP模型和MLR模型的输入,通过多分类目标识别模型对识别任务进行处理,最终完成水下目标识别。

    多波束前视声呐的数据处理方法、装置、设备及存储介质

    公开(公告)号:CN118733297A

    公开(公告)日:2024-10-01

    申请号:CN202410859372.3

    申请日:2024-06-28

    Abstract: 本发明提供了一种多波束前视声呐的数据处理方法、装置、设备及存储介质,属于声呐信号处理领域,该方法包括:根据处理该原始波束域数据过程中产生的多个数据类型,将该处理过程划分为多个阶段;建立对应于每个阶段的处理流水线和数据共享区域;将处理过程中产生的数据存放在对应类型的数据共享区域,通过对应的处理流水线中的任务核对该数据同步进行处理,将同步处理结果进行拼接并放入下一阶段的数据共享区域;将最后阶段数据共享区域中的数据进行拼接得到目标数据。这样,能够避免声呐的基元数多、采样频率高、数据量大带来的实时处理问题,同时能够动态选择数据的处理路径,提高数据处理的灵活性,并且具有软硬解耦特征,提高了系统稳定性。

    一种基于前视声纳分区的水下目标检测装置及运行方法

    公开(公告)号:CN118655582A

    公开(公告)日:2024-09-17

    申请号:CN202410787108.3

    申请日:2024-06-18

    Abstract: 本发明公开了一种基于前视声纳分区的水下目标检测装置及运行方法,涉及水声信号处理技术领域,本发明通过显示量程范围,从波束和距离两个维度对波束域进行网格划分,形成多个局部检测网格,对对应波束域数据压缩成像形成图像域数据,并根据对应图像域数据的信噪比确定每个局部检测网格的检测阈值以确定水下目标,本发明通过对检测区域的波束域数据按波束和距离进行网格划分,可将信号域对应的波束域数据中的水下目标、水下混响及声线变化等所产生的波束域数据分别进行合理划分,对每个局部检测网格的波束域数据进行压缩成像,从图像域数据的信噪比获取检测阈值的角度将水下目标、水下混响及声线变化等特征对应的参量精确识别,精确识别水下目标。

Patent Agency Ranking