-
公开(公告)号:CN116881668A
公开(公告)日:2023-10-13
申请号:CN202311058259.7
申请日:2023-08-22
Applicant: 哈尔滨工程大学 , 哈尔滨工程大学三亚南海创新发展基地 , 海南俊码数据研究院有限公司
Inventor: 庄园 , 樊泽楷 , 刘昊洋 , 王诚 , 段毅航 , 蔡成涛 , 王巍 , 李承国 , 王小芳 , 杨明刚 , 陈征平 , 陈志远 , 李晋 , 曹雪 , 冯晓宁 , 付岩 , 关键 , 兰海燕 , 李智慧 , 刘海波
IPC: G06F18/20 , G06F18/22 , G06F18/25 , G06N3/0464 , G06N3/08
Abstract: 本发明提出基于跨模态预训练模型的智能合约相似性检测方法,包括:构建智能合约的控制流图;提取所述智能合约中的注释信息,将所述控制流图与所述注释信息进行对应,获取对应图;将所述对应图中的信息输入预设的跨模态预训练模型,获取合约的特征表示向量;基于所述特征表示向量,通过阈值进行合约相似性的判定。本发明能实现高精度智能合约语义相似性检测。
-
公开(公告)号:CN119295523A
公开(公告)日:2025-01-10
申请号:CN202411304516.5
申请日:2024-09-19
Applicant: 哈尔滨工程大学
Abstract: 一种基于双向状态空间模型的单目深度估计方法、设备与介质,涉及一种图像处理技术,解决了目前的自监督方法在长序列建模、训练速度、推理速度以及捕捉场景复杂细节方面均存在不足且模型在稀疏监督下的优化效果不好的问题。本发明单目深度估计方法包括如下步骤:构建编码器‑解码器结构,包括有连续膨胀卷积模块和双向状态空间模块,由编码器生成训练图像的中间特征,对长距离中间特征信息进行建模,由解码器生成输出特征;构建姿态估计模型,并利用解码器生成的输出特征与训练图像的深度估计进行联合重建,对学习目标建模,设计目标图像与重建图像的损失函数来优化网络;采用公开的KITTI数据集对所构建的模型进行训练得到权重模型,并对训练完成的模型对于单目图像深度估计的精度进行评估。本发明用于图像单目深度估计。
-
公开(公告)号:CN116741204A
公开(公告)日:2023-09-12
申请号:CN202310768780.3
申请日:2023-06-28
Applicant: 哈尔滨工程大学
IPC: G10L25/51 , G10L25/24 , G06F18/214
Abstract: 本发明公开了一种基于层次元数据信息约束的异常声音检测方法,将待检测声音的音频波形转换为Log‑Mel谱频特征,然后输入至预先训练的特征提取器中,得到高级音频特征#imgabs0#计算高级音频特征#imgabs1#与待检测声音对应机器ID的每个属性组中心cm的马氏距离,选取其中最小值作为异常分数A,M为对应机器ID下的属性组个数,当A大于给定阈值时,判定待检测声音为异常声音;所述属性组中心cm为训练集音频片段经过预先训练的特征提取器得到的高级音频特征的平均值;本发明设计了元数据信息树结构,充分利用元数据信息提取更精细的特征,有效地提升异音检测系统的性能,解决现有工业异音检测方法在域偏移下性能不足,检测结果可信度低的问题。
-
公开(公告)号:CN116230012A
公开(公告)日:2023-06-06
申请号:CN202310177110.4
申请日:2023-02-28
Applicant: 哈尔滨工程大学
Abstract: 本发明提出了一种基于元数据对比学习预训练的两阶段异音检测方法,属于声音检测领域,解决了现有单阶段异音检测方法对声音信号与其对应元数据信息匹配关系发掘程度不高,难以区分不同元数据信息下声音信号差异的问题。本发明提供的两阶段异音检测方法包含元数据对比学习预训练和自监督微调两个阶段,元数据对比学习预训练阶段加强了相同元数据信息下的声音信号关联,放大了不同元数据信息下声音信号的距离,学习到了能够根据元数据信息区分不同声音信号的能力;自监督微调部分在元数据对比学习获得的预训练参数基础上,进行优化微调,进一步提升了对不同元数据信息下声音信号的区别能力,进而提升了异音检测方法的性能表现与稳定性。
-
公开(公告)号:CN111028277B
公开(公告)日:2023-01-10
申请号:CN201911256966.0
申请日:2019-12-10
Applicant: 中国电子科技集团公司第五十四研究所 , 哈尔滨工程大学
IPC: G06T7/33
Abstract: 本发明公开了遥感图像配准技术领域的基于伪孪生卷积神经网络的SAR和光学遥感图像配准方法,先对特征图像块的采集和匹配,再进行异常点去除和最终配准,采用了最大化正样本和难负样本之间的特征距离的策略,并且定义了新的损失函数对网络进行训练,伪孪生网络的两个分支通过卷积运算连接,得到两个输入图像块之间的相似性得分;本发明通过提出了伪孪生卷积神经网络体系结构,使得伪孪生网络的左分支和右分支能够分别输入不同大小的光学和SAR遥感图像,能够解决在极高分辨率下光学和SAR遥感图像中识别相应图像块的任务。
-
公开(公告)号:CN114155879B
公开(公告)日:2022-07-01
申请号:CN202111475597.1
申请日:2021-12-06
Applicant: 哈尔滨工程大学
Abstract: 本发明公开的属于异音检测方法技术领域,具体为一种利用时频融合补偿异常感知及稳定性的异音检测方法,借助从声学目标原始音频信号x∈R1*L获取的时域信息和频域信息形成感知互补;时频域融合特征输入深度神经网络,经过网络学习从而获得对于待检测声学目标的状态感知,针对现有异音检测方法所采用的Log‑Mel谱特征对一定声学目标缺乏感知能力的问题,本发明设计了从时域角度构建的可学习特征与Log‑Mel谱相融合,实现了时频域信息互补的双赢增益机制,本发明设计的时频域融合的可学习特征能够有效地提升异音检测系统的稳定性,解决现有工业异音检测方法稳定性不足,检测结果可信度低的问题。
-
公开(公告)号:CN110189761B
公开(公告)日:2021-03-30
申请号:CN201910421436.0
申请日:2019-05-21
Applicant: 哈尔滨工程大学
IPC: G10L21/0208
Abstract: 本发明提供的是一种基于贪婪深度字典学习的单信道语音去混响方法。步骤一、将输入的混沌、纯净语音进行信号预处理,进行特征的提取;步骤二、结合稀疏和贪婪深度字典学习对单信道语音去混响问题进行模型建立;步骤三、将建立好的模型与提取的特征进行模型训练,得到基本系数;步骤四、再次输入混沌、纯净语音信号数据进行测试,经过傅里叶逆变换后,最终得到纯净语音。本发明将传统的单信道语音去混响方法与深度字典学习相结合,提高单信道去混响的效果,使其具有良好的去混响效果,提高深度网络结构的可推导性。
-
公开(公告)号:CN110189761A
公开(公告)日:2019-08-30
申请号:CN201910421436.0
申请日:2019-05-21
Applicant: 哈尔滨工程大学
IPC: G10L21/0208
Abstract: 本发明提供的是一种基于贪婪深度字典学习的单信道语音去混响方法。步骤一、将输入的混沌、纯净语音进行信号预处理,进行特征的提取;步骤二、结合稀疏和贪婪深度字典学习对单信道语音去混响问题进行模型建立;步骤三、将建立好的模型与提取的特征进行模型训练,得到基本系数;步骤四、再次输入混沌、纯净语音信号数据进行测试,经过傅里叶逆变换后,最终得到纯净语音。本发明将传统的单信道语音去混响方法与深度字典学习相结合,提高单信道去混响的效果,使其具有良好的去混响效果,提高深度网络结构的可推导性。
-
公开(公告)号:CN116630794B
公开(公告)日:2024-02-06
申请号:CN202310457764.2
申请日:2023-04-25
Applicant: 北京卫星信息工程研究所 , 哈尔滨工程大学
IPC: G06V20/10 , G06V10/77 , G06V10/80 , G06V10/766 , G06V10/764 , G06T7/73 , G06V10/82 , G06N3/048 , G06N3/08
Abstract: 本发明涉及一种基于排序样本选择的遥感图像目标检测方法、电子设备,获取遥感图像及对应的目标标签,并进行预处理;通过特征提取主干网络以及特征金字塔网络,得到对应的多尺度特征图;构建分类分支网络以及位置及角度回归分支网络,对多尺度特征图进行预测,获得目标预测值;利用目标标签以及预测值,在多尺度特征图上计算得到交并比自适应阈值,筛选样本点以获得满足条件的正负样本;计算分类排序损失、定位排序损失以及回归损失进行网络训练;重复执行上述步骤,训练检测模型;利用检测模型进行检测。本发明,缓解正负样本不均衡导致传统分类能力难以学习的问题,促进目标检测性能提升,对高分辨率遥感图像旋转框目标检测具有重要意义。
-
公开(公告)号:CN112562706B
公开(公告)日:2023-05-05
申请号:CN202011376556.2
申请日:2020-11-30
Applicant: 哈尔滨工程大学
IPC: G10L21/02 , G10L21/0208 , G10L25/03
Abstract: 本发明提供一种基于时间潜在域特定说话人信息的目标语音提取方法,包括时间潜在域特征转换模型、目标说话人特征信息指导器与增强提取模块;待处理的复杂声学环境语音信息经过时间潜在域特征转换模型的处理将映射到潜在空间的特征矩阵,此特征矩阵将分别进入目标说话人特征信息指导器与增强提取模块;在目标说话人特征信息指导器中,特征矩阵将被判定为与某一特定的目标说话人潜在特征具有相关性,或者不包含目标说话人特征。本发明能实现从复杂声学环境语音信号到特定目标语音信号的端到端处理,能高效提取出针对特定任务的目标说话人信息,而不受其他干扰信号的影响,保障了模型传递给后续任务的特定目标语音信号具备极高的语音质量与可感知性。
-
-
-
-
-
-
-
-
-