-
公开(公告)号:CN108280856B
公开(公告)日:2021-05-07
申请号:CN201810139292.5
申请日:2018-02-09
Applicant: 哈尔滨工业大学
IPC: G06T7/73
Abstract: 基于混合信息输入网络模型的未知物体抓取位姿估计方法,属于机器人自主抓取领域。本发明为了实现机器人对未知物体的快速、有效抓取。对训练图像数据集中的图像混合信息进行预处理;构建基于混合信息输入的信息融合机制,并搭建神经网络模型;对包含混合信息融合机制的网络模型参数进行训练,获得优化后的混合信息输入网络模型;利用基于RGB‑D图像的物体分割技术实现对传感器采集到的场景图像进行可抓取物体分割;利用基于反馈信息的候选区域生成机制,搜索获得物体上的最佳抓取区域;利用深度信息估计机器人在最佳抓取区域的抓取位置和抓取姿态,进而获得抓取物体时的抓取位姿。该方法有利于机器人快速、准确地实现对未知物体的自主抓取。
-
公开(公告)号:CN118503827A
公开(公告)日:2024-08-16
申请号:CN202410661126.7
申请日:2024-05-27
Applicant: 哈尔滨工业大学
IPC: G06F18/2415 , G06F18/213 , G06N3/0455 , G06N3/084
Abstract: 本发明公开了一种鲁棒工业设备异常音检测方法,以解决工业环境下异常音检测技术的鲁棒性问题。在工业应用中,由于设备频繁切换工况,导致正常状态的音频数据不均衡,深度模型容易忽略少数不常见样本,从而影响异常音检测模型的鲁棒性,现有技术尚未有效解决这一问题。本发明采用增量高斯混合模型,对正常样本的重构误差,进行动态概率建模,从而分辨出少数样本,并结合焦点损失,在训练过程中对其进行强调,同时结合矩损失,以促进异常得分分布的集中性,并在检测中综合考虑重构误差及误差值的概率,从而提高了异常音检测的鲁棒性。本发明可以显著提升异常音检测技术的鲁棒性,特别是在面对实际应用中常见的采样不均匀问题时。
-
公开(公告)号:CN115249486B
公开(公告)日:2024-04-09
申请号:CN202210898097.7
申请日:2022-07-28
Applicant: 哈尔滨工业大学
IPC: G10L21/0216 , G10L21/0264 , G10L25/51 , G06F18/2321
Abstract: 本发明公开了一种旋转机械音异常识别预处理方法及装置,方法包括以下处理阶段:采集阶段,声音采集传感器获取信号,传输并存储到本地或云服务器上;准备阶段,包含信噪比估计、分解还原度数值计算、还原精度计算、F0基频检测;处理阶段,包含Ramanujin子空间投影分解最小子空间个数q‑min搜索、Ramanujin子空间投影分解最小扫描长度L‑min搜索、最佳参数下的Ramanujin子空间投影分解。本发明通过应用估计的信噪比数值,推算Ramanujin子空间投影分解的信号还原度数值,以及还原精度,并通过F0基频检测确定最大Ramanujin子空间投影分解最大扫描长度L,并将其作为初始值,搜索Ramanujin子空间投影分解最小子空间个数q‑min,以及Ramanujin子空间投影分解最小扫描长度L‑min,由此得到最优Ramanujin子空间投影分解参数,获得旋转机械音最佳的分解降噪结果,显著提升降噪水平,提升异常识别准确率。
-
公开(公告)号:CN111179440A
公开(公告)日:2020-05-19
申请号:CN202010003676.1
申请日:2020-01-02
Applicant: 哈尔滨工业大学
Abstract: 一种面向自然场景的三维物体模型检索方法,本发明属于图像处理技术领域。本发明为解决自然图像与多视角表达的三维模型存在的数据领域差异,实现自然图像对多视角三维物体的检索。技术要点:模型的多视角投影与渲染;构建跨领域检索网络;构建三元组立体损失训练数据;训练自然图像到多视角模型映射的网络;自然图像的模型检索。本发明所提出的面向自然场景的三维物体模型检索方法的检索正确率达到94.8%。该方法有效解决了自然图像检索三维物体模型问题,在增强现实和计算机辅助设计等领域,具有广泛的应用前景。
-
公开(公告)号:CN110990608A
公开(公告)日:2020-04-10
申请号:CN201911224313.4
申请日:2019-12-03
Applicant: 哈尔滨工业大学
IPC: G06F16/53 , G06F16/55 , G06F16/583 , G06N3/04
Abstract: 一种基于Siamese结构双向长短时记忆网络的三维模型检索方法,属于图像处理技术领域,为了解决三维模型多视角特征的融合问题,通过Siamese结构长短时记忆经网络融合视角信息,增强多视角三维模型的检索准确率。构建卷积神经网络;构建双向长短时记忆网络网络;引入注意力机制增强模型特征的表达;构建基于Siamese结构的双向长短时记忆网络,融合多视角信息;对Siamese结构的长短时记忆网络模型参数进行训练,对多视角三维模型进行检索。本发明可实现多视角表达的三维模型的检索,在三维模型分类、检索领域,具有广泛的应用前景。
-
公开(公告)号:CN109344845A
公开(公告)日:2019-02-15
申请号:CN201811112938.7
申请日:2018-09-21
Applicant: 哈尔滨工业大学
Abstract: 一种基于Triplet深度神经网络结构的特征匹配方法,属于图像处理技术领域。本发明的目的在于解决现有技术的SIFT及基于深度学习的TFeat、HardNet等特征描述方法存在匹配性能较差的问题。本发明设计了一个对训练样本均值和方差做约束的新型损失函数,结合Triplet深度神经网络,可得到性能优异的特征描述,用高斯分布描述匹配特征对和不匹配特征对的距离分布,根据减小特征匹配误差等价于减小两个匹配特征对距离分布重叠面积这一原则,得出对训练样本均值和方差做约束的新型损失函数。实验结果表明,与现有特征描述方法相比,本发明在匹配性能上得到了提升。
-
公开(公告)号:CN102013653A
公开(公告)日:2011-04-13
申请号:CN201010526848.X
申请日:2010-11-01
Applicant: 哈尔滨工业大学
Abstract: 本发明涉及一种在高压线上除冰和巡检并能穿越障碍物的机器人,包括除冰刀机构、行走机构、随动越障机构、对称定心机构、和安装在机身顶部的巡检摄像头;除冰刀由偏心曲柄滑块机构带动,通过电机轴齿轮驱动;行走机构由摩擦轮和夹持装置组成,摩擦轮靠链轮传递动力;随动越障机构由不与摩擦轮固联的扇轮组成,起悬吊机身的作用,越障时随障碍物向后转动,使悬垂金具等障碍物从机身穿过。本发明由一个电机驱动,可自行完成高压线除冰及巡检工作,避免了人工高空危险事故的发生,提高了救灾抢险的效率。
-
-
公开(公告)号:CN115495567A
公开(公告)日:2022-12-20
申请号:CN202211305485.6
申请日:2022-10-24
Applicant: 科大讯飞股份有限公司 , 科大讯飞(北京)有限公司 , 河北省讯飞人工智能研究院
IPC: G06F16/332 , G06F16/33 , G06F16/35 , G06F40/30 , G06K9/62
Abstract: 本发明提供一种问题聚类方法、装置、电子设备和存储介质,其中方法包括:获取第一问题簇,所述第一问题簇包括待聚类的第一问题;确定所述第一问题簇中的基准问题及其基准回复,以及所述第一问题簇中的第一问题以所述基准回复作为对话回复的回复概率;基于所述第一问题的回复概率,对所述第一问题进行聚类,得到第二问题簇。本发明提供的方法、装置、电子设备和存储介质,基于第一问题以基准回复作为对话回复的回复概率进行问题聚类,使得问题聚类的依据能够更加贴合实际对话场景下的问题语义,由此保证问题聚类的可靠性,优化问题聚类效果。
-
公开(公告)号:CN114118022A
公开(公告)日:2022-03-01
申请号:CN202111452650.6
申请日:2021-12-01
Applicant: 科大讯飞股份有限公司
IPC: G06F40/151 , G06F40/194 , G06F40/189 , G06F40/284 , G06F40/30
Abstract: 本发明提供一种文本表示方法、装置、电子设备与存储介质,所述方法包括:确定目标文本;将目标文本输入至跨语种文本表示模型,得到跨语种文本表示模型输出的文本表示,所述文本表示为所述目标文本的编码表示;其中,所述跨语种文本表示模型是以样本文本的文本表示与对应的样本正例的正例表示之间的一致性,以及所述样本文本的文本表示与对应的样本负例的负例表示之间的差异性为目标训练得到的,所述样本正例与所述样本文本的语种不同且语义相同,所述样本负例与所述样本文本的语种不同且语义不同。本发明提供的方法、装置、电子设备与存储介质,实现了不需要花费长时间的训练、仅需要少量的语料数据即可获得跨语种文本表示模型效果显著的提升。
-
-
-
-
-
-
-
-
-