一种基于时延补偿和双耳一致性的双耳声音源定位方法

    公开(公告)号:CN103901400B

    公开(公告)日:2016-08-17

    申请号:CN201410142777.1

    申请日:2014-04-10

    Inventor: 刘宏 张结 丁润伟

    Abstract: 本发明公开了一种基于时延补偿和双耳一致性的双耳声音源定位方法,分别在时域和频域基于最小化均方误差准则推导出双耳能量差和双耳时间差,利用双耳一致性函数改进了时延估计的精度,在得到双耳定位特征之后,利用贝叶斯分层的搜索策略确定声音源的转向角和俯仰角,即达到定位的目的。首先,双耳一致性函数保证了应用于定位的信号帧为可靠的;其次,时延补偿打破了传统的需要两个独立的算法估计双耳时间差和双耳能量差的局限性,使双耳特征提取的手段更具多样化与普适性(适合多种不同程度地噪声环境);最后,分层的定位系统能够有效地减少特征匹配的次数,降低了算法的时间复杂度,保证了声源定位系统的实时性要求。

    一种基于动态区域划分的机器人安全路径规划方法

    公开(公告)号:CN103365293B

    公开(公告)日:2015-11-18

    申请号:CN201310295642.4

    申请日:2013-07-15

    Inventor: 刘宏 饶凯

    Abstract: 本发明涉及一种基于动态区域划分的机器人安全路径规划方法,其步骤包括:1)在路径空间中随机选择一个采样点作为扩展方向,并选取离该随机采样点路径最短的临近节点;2)根据障碍物占据区域的大小对所述临近节点进行区域划分并建立路径的安全性评价准则,进而确定最优临近节点;3)根据最优临近节点及其区域划分结果选择合适的方式进行路径扩展,生成新的节点并将其添加到扩展树中,逐步生成机器人安全路径。本发明针对复杂可变的未知环境,考虑在多自由度机器人的路径规划中,使路径地图中的节点含有当地局部区域的环境信息,并用这个环境信息指导规划器高效、安全、实时地规划路径。

    一种基于双耳匹配滤波器的双耳声音源定位方法

    公开(公告)号:CN103901401A

    公开(公告)日:2014-07-02

    申请号:CN201410143474.1

    申请日:2014-04-10

    Inventor: 刘宏 张结 丁润伟

    CPC classification number: G01S5/18

    Abstract: 本发明公开了一种新的基于贝叶斯分层模式的双耳声音源定位方法,首先,可靠频带选择机制保证了选择用于估计双耳时间差的频带是可靠的,提高了时间差的估计精度;其次,利用双耳能量差来缩小第一层得到的候选方向集合;再次,第三层提出了双耳匹配滤波器作为新的双耳定位特征,它描述了双耳信号之间的差异,能够充分表达双耳时间差和双耳能量差之间的关系;最后,针对三层定位过程中搜索空间逐渐缩小,采用贝叶斯决策的准则得到概率最大的方向。这种分层的定位系统能够有效地减少特征匹配的次数,降低了算法的时间复杂度,保证了声源定位系统的实时性要求。

    一种基于时延补偿和双耳一致性的双耳声音源定位方法

    公开(公告)号:CN103901400A

    公开(公告)日:2014-07-02

    申请号:CN201410142777.1

    申请日:2014-04-10

    Inventor: 刘宏 张结 丁润伟

    CPC classification number: G01S5/18

    Abstract: 本发明公开了一种基于时延补偿和双耳一致性的双耳声音源定位方法,分别在时域和频域基于最小化均方误差准则推导出双耳能量差和双耳时间差,利用双耳一致性函数改进了时延估计的精度,在得到双耳定位特征之后,利用贝叶斯分层的搜索策略确定声音源的转向角和俯仰角,即达到定位的目的。首先,双耳一致性函数保证了应用于定位的信号帧为可靠的;其次,时延补偿打破了传统的需要两个独立的算法估计双耳时间差和双耳能量差的局限性,使双耳特征提取的手段更具多样化与普适性(适合多种不同程度地噪声环境);最后,分层的定位系统能够有效地减少特征匹配的次数,降低了算法的时间复杂度,保证了声源定位系统的实时性要求。

    一种基于流行度的P2P流媒体复制方法

    公开(公告)号:CN103458315A

    公开(公告)日:2013-12-18

    申请号:CN201310385411.2

    申请日:2013-08-29

    Inventor: 杨戈 高兵 刘宏

    Abstract: 本发明公开了一种基于流行度的P2P流媒体复制方法。本方法为:1)从P2P流媒体系统中选取若干节点作为候选节点;2)统计P2P流媒体系统中每个流媒体文件的长度及其期望的赤字带宽,计算流媒体文件的流行度,根据流媒体文件的流行度值确定出将要变热的流媒体文件Mi;3)计算当前观看这些Mi的节点的总的可利用存储空间的大小,以及这些Mi所期望的存储空间之和的大小;如果系统当前总的可以利用的存储空间大期望的存储空间之和,赋期望存储空间值做为各个Mi的存储空间大小,并把它复制到当前节点上;否则,对于每个流媒体文件的赋其与副本最优速率相近的缓存空间大小。然后复制到在综合性能比较好的节点上。

    一种基于改进的并行模型组合的声音事件识别方法

    公开(公告)号:CN103310789A

    公开(公告)日:2013-09-18

    申请号:CN201310239724.7

    申请日:2013-06-17

    Inventor: 刘宏 王一 李晓飞

    Abstract: 本发明涉及一种基于改进的并行模型组合的声音事件识别方法,其步骤包括:1)录制声音事件的数据,根据干净声音事件训练得到GMM高斯混合模型,建立干净声音事件模板;2)在室内真实有噪声的环境下获取当前环境中的噪声数据,根据噪声数据训练得到GMM,建立噪声模板;3)对噪声模板和干净声音事件模板采用改进的并行模型融合的方法,得到带噪声音事件模板;4)采样得到带噪声音事件样本信号,根据带噪声音事件模板中的参数对样本信号进行声音识别。本发明通过建立能够更好描述背景噪声特征分布的GMM来作为PMC方法中一个输入,建立5种声音事件的干净GMM作为PMC的另一个输入。同时本发明保证了识别系统对噪声的鲁棒性。

    一种实时的婴儿啼哭声识别方法

    公开(公告)号:CN103280220A

    公开(公告)日:2013-09-04

    申请号:CN201310148422.9

    申请日:2013-04-25

    Inventor: 刘宏 李晓飞 付卓

    Abstract: 本发明涉及一种实时的婴儿啼哭声识别方法,其步骤包括:1)录制婴儿啼哭声信号并建立声音库,进行预处理;2)当啼哭声开始时,采集得到婴儿啼哭声后采样得到实时数字信号,并在固定时间窗内对实时数字信号中的完整语音段依次进行分帧、加窗处理后提取得到实时特征向量序列;3)将实时特征向量序列与该GMM模板进行匹配,得到似然度最大的类,将最大的类作为识别结果,并对当前识别结果进行投票;4)当啼哭声结束后,根据投票结果判断婴儿啼哭声类别,完成识别,进行婴儿状况处理。本发明能够实时快速地判别婴儿啼哭声属于饥饿型、困倦型、尿湿型和疼痛型中的哪种类型,辅助护理人员及时反应、识别性能高。

    一种基于相机感知解耦和不确定性建模的人物再识别方法

    公开(公告)号:CN118609156A

    公开(公告)日:2024-09-06

    申请号:CN202410639702.8

    申请日:2024-05-22

    Inventor: 刘宏 郭静文

    Abstract: 本发明公开了一种基于相机感知解耦和不确定性建模的人物再识别方法。本方法为:1)构建由特征提取模块、相机感知解耦模块、不确定性建模模块、协同教学模块四个部分构成的CSUE模型;2)利用有标记的源数据集来预训练CSUE模型;3)将机器人拍摄的无标识照片输入预训练后的CSUE模型,得到无标识照片的识别结果。本发明利用特征提取模块对机器人所拍摄的照片进行特征提取用于生成伪标签,实现对机器人拍摄的照片特征提取与目标物体的初步标记,利用相机感知解耦模块、不确定性建模模块对伪标签进行微调,完成机器人拍摄的照片中物体的最终标记。本发明充分利用标签的不确定性,高效的细化了伪标签,可以灵活地使用现有的网络架构。

    一种基于优化机制的三维人体姿态估计方法及系统

    公开(公告)号:CN118537891A

    公开(公告)日:2024-08-23

    申请号:CN202410589241.8

    申请日:2024-05-13

    Abstract: 本发明涉及一种基于优化机制的三维人体姿态估计方法及系统。该方法将二维姿态检测器从待估计图像中提取的二维骨架信息用于初始化一个隐藏变量;将隐藏变量送入预训练的三维人体姿态估计模型,输出三维骨架;用相机内参数将三维骨架投影到二维平面,计算投影损失;用投影损失优化隐藏变量,迭代多次;最后将优化后的隐藏变量作为训练好的三维人体姿态估计模型的输入,输出得到三维人体姿态估计结果。本发明结合了预训练的三维人体姿态估计模型和优化策略的优势,在推理阶段采用投影约束保证生成的姿态在二维空间上是对齐的,有效地保证生成的三维人体姿态更加真实可靠。

    一种基于时空信息聚合的对比自监督人体行为识别方法及系统

    公开(公告)号:CN115019397B

    公开(公告)日:2024-04-19

    申请号:CN202210680841.6

    申请日:2022-06-15

    Abstract: 本发明涉及一种基于时空信息聚合的对比自监督人体行为识别方法及系统。该方法对输入的骨架动作序列进行数据增强得到增强后的两个动作序列;利用第一编码器和第二编码器即动量更新编码器将其编码成特征向量;利用预测器得到另一组特征向量,通过损失函数构造有效的单个数据流的特征空间。进一步地,计算骨架序列的运动信息和骨骼信息,并同样作为上述步骤的输入,并在得到特征之后计算特征相似度,数据流内部的相似度矩阵做尖锐处理,并在不同数据流间投票融合,得到相似度伪标签,将时空信息有效聚合后约束单个数据流的分布,来训练更优的模型。本发明训练得到的模型可以在实际应用中取得很好的行为识别效果。

Patent Agency Ranking