-
公开(公告)号:CN112562707A
公开(公告)日:2021-03-26
申请号:CN202011376572.1
申请日:2020-11-30
Applicant: 哈尔滨工程大学
IPC: G10L21/02 , G10L21/0208
Abstract: 本发明提供一种单信道目标语音增强方法,包括如下步骤:步骤一:语音信号的预处理与特征转换,引入时间潜在域信息,将时序波形信息通过深度学习框架拓展映射到对应潜在空间域的过程及其逆向变换;步骤二:基于生成信号权重的目标函数;步骤三:引入时序TCN网络模型;本发明网络能实现从混合源语音到目标语音信号的端到端处理,网络的增强性能优秀,能良好还原目标语音信号,同时提升了数据处理的并行处理能力,并能通过自身的数据增广丰富样本集,提升模型性能。
-
公开(公告)号:CN112562706A
公开(公告)日:2021-03-26
申请号:CN202011376556.2
申请日:2020-11-30
Applicant: 哈尔滨工程大学
IPC: G10L21/02 , G10L21/0208 , G10L25/03
Abstract: 本发明提供一种基于时间潜在域特定说话人信息的目标语音提取方法,包括时间潜在域特征转换模型、目标说话人特征信息指导器与增强提取模块;待处理的复杂声学环境语音信息经过时间潜在域特征转换模型的处理将映射到潜在空间的特征矩阵,此特征矩阵将分别进入目标说话人特征信息指导器与增强提取模块;在目标说话人特征信息指导器中,特征矩阵将被判定为与某一特定的目标说话人潜在特征具有相关性,或者不包含目标说话人特征。本发明能实现从复杂声学环境语音信号到特定目标语音信号的端到端处理,能高效提取出针对特定任务的目标说话人信息,而不受其他干扰信号的影响,保障了模型传递给后续任务的特定目标语音信号具备极高的语音质量与可感知性。
-
公开(公告)号:CN113838107B
公开(公告)日:2023-12-22
申请号:CN202111117036.4
申请日:2021-09-23
Applicant: 哈尔滨工程大学
IPC: G06T7/33 , G06V10/44 , G06V10/52 , G06V10/80 , G06V10/75 , G06V10/82 , G06N3/0464 , G06N3/044 , G06N3/0455 , G06N3/0475 , G06N3/094
Abstract: 本发明属于遥感图像配准技术领域,具体涉及一种基于稠密连接的异源图像自动配准方法。本发明先对SAR与光学图像进行转换,再使用结合注意力机制的卷积神经网络进行特征点的提取,接着将提取到的特征点进行特征编码并完成预匹配,通过使用高斯混合模型进行动态内联点选择,从而完成特征点的匹配,最后进行图像配准,得到最终结果。本发明通过使用循环生成式对抗网络,解决了异源图像因成像原理不同给配准带来的困难,同时使用改进后的稠密连接Densenet结构提取特征点,极大提高了精度,从而提升后续模型配准的性能。
-
公开(公告)号:CN116630794A
公开(公告)日:2023-08-22
申请号:CN202310457764.2
申请日:2023-04-25
Applicant: 北京卫星信息工程研究所 , 哈尔滨工程大学
IPC: G06V20/10 , G06V10/77 , G06V10/80 , G06V10/766 , G06V10/764 , G06T7/73 , G06V10/82 , G06N3/048 , G06N3/08
Abstract: 本发明涉及一种基于排序样本选择的遥感图像目标检测方法、电子设备,获取遥感图像及对应的目标标签,并进行预处理;通过特征提取主干网络以及特征金字塔网络,得到对应的多尺度特征图;构建分类分支网络以及位置及角度回归分支网络,对多尺度特征图进行预测,获得目标预测值;利用目标标签以及预测值,在多尺度特征图上计算得到交并比自适应阈值,筛选样本点以获得满足条件的正负样本;计算分类排序损失、定位排序损失以及回归损失进行网络训练;重复执行上述步骤,训练检测模型;利用检测模型进行检测。本发明,缓解正负样本不均衡导致传统分类能力难以学习的问题,促进目标检测性能提升,对高分辨率遥感图像旋转框目标检测具有重要意义。
-
公开(公告)号:CN114154538B
公开(公告)日:2022-09-02
申请号:CN202111421620.9
申请日:2021-11-26
Applicant: 哈尔滨工程大学
Abstract: 本发明属于工业声音异常检测技术领域,具体涉及一种基于相位编码和设备信息的工业声音异常检测系统。本发明能借助相位信息补足工业声音信号的精细度,获得高精度的声学特征,能够对高精度的声学特征进行建模,着重提升系统对于异常信息的敏感度,同时感知到不同工业设备之间的细微差异,规避了设备之间产生的声学干扰,并对建模结果进行高效率高精度的异常分数判定,具备优秀的工业声音异常检测性能。
-
公开(公告)号:CN114155835B
公开(公告)日:2022-07-08
申请号:CN202111475701.7
申请日:2021-12-06
Applicant: 哈尔滨工程大学
IPC: G10L15/02 , G10L15/06 , G10L15/16 , G10L15/26 , G10L25/30 , G10L25/51 , G06F40/216 , G06F40/30 , G06N3/04 , G06N3/08
Abstract: 本发明涉及一种音频语意概述方法,具体为一种融合全局场景与局部事件信息的音频语意概述方法,首先对实际场景中产生的音频进行建模分析,随后从声学场景的宏观全局特性入手,并融合了对于场景内各音频事件的精细化感知,最终生成贴合人类自然语言逻辑的语意概述文本,本发明对于声学场景中局部声音事件的精细化感知为构建音频特征的语意信息与自然语言语意信息的映射提供了细粒度的信息感知方式,能够有效规避传统方法对于音频事件的误识别与内容忽略,有助于构建更高语意层次的人机交互过程;此外,本发明提供了全新的注意力计算机制,相比传统注意力机制降低了计算成本。
-
公开(公告)号:CN113838107A
公开(公告)日:2021-12-24
申请号:CN202111117036.4
申请日:2021-09-23
Applicant: 哈尔滨工程大学
Abstract: 本发明属于遥感图像配准技术领域,具体涉及一种基于稠密连接的异源图像自动配准方法。本发明先对SAR与光学图像进行转换,再使用结合注意力机制的卷积神经网络进行特征点的提取,接着将提取到的特征点进行特征编码并完成预匹配,通过使用高斯混合模型进行动态内联点选择,从而完成特征点的匹配,最后进行图像配准,得到最终结果。本发明通过使用循环生成式对抗网络,解决了异源图像因成像原理不同给配准带来的困难,同时使用改进后的稠密连接Densenet结构提取特征点,极大提高了精度,从而提升后续模型配准的性能。
-
-
-
-
-
-