-
公开(公告)号:CN105869651B
公开(公告)日:2019-05-31
申请号:CN201610167885.3
申请日:2016-03-23
Applicant: 北京大学深圳研究生院
IPC: G10L21/0216 , G10L21/0208
Abstract: 本发明公开了一种基于噪声混合相干性的双通道波束形成语音增强方法。自适应波束形成在无混响条件下可以有效地抑制方向性噪声信号,但在混响存在的条件下其效果大大降低。针对这个问题,本发明提出了一种基于噪声混合相干性的双通道波束形成方法。考虑到声场中同时存在相干性和散射性噪声,本发明提出用混合噪声声场来代替传统的散射性声场的假设,首先估计出混合噪声声场中的噪声相干性,用其来估计噪声的功率谱,并将噪声功率谱估计结果用于计算频域滤波的增益函数。噪声与混响信号经过频域滤波处理后,残留的噪声再通过最小方差无失真响应波束形成器进一步处理。实验证明利用本发明的方法增强后的语音质量相比于传统的方法有较明显的提高。
-
公开(公告)号:CN109165540A
公开(公告)日:2019-01-08
申请号:CN201810608363.1
申请日:2018-06-13
Applicant: 深圳市感动智能科技有限公司 , 北京大学深圳研究生院
Abstract: 本发明公开一种基于先验候选框选择策略的行人搜索方法和装置。该方法包括:根据训练集中所有行人边界框的长和宽构建行人候选框特征向量,包含长宽比和长度两个元素;通过k-means++算法选出初始化聚类中心;利用k-means算法进行迭代聚类,得到聚类后的先验候选框;将训练集中的行人图像输入预先定义的行人搜索网络,利用先验候选框生成候选行人并识别出行人的身份,通过训练得到训练好的行人搜索网络;将行人探针和监控场景图像分别通过训练好的行人搜索网络,得到行人探针特征以及监控图像中候选行人的特征,通过计算该两种特征的相似性获得行人探针所在的监控图像及其具体位置。本发明能够有效提高行人搜索的精度和速度。
-
公开(公告)号:CN108986168A
公开(公告)日:2018-12-11
申请号:CN201810609050.8
申请日:2018-06-13
Applicant: 深圳市感动智能科技有限公司 , 北京大学深圳研究生院
Abstract: 本发明公开一种基于深度度量学习结合词袋树模型的机器人回环检测方法和装置。该方法为:1)输入长时间的环境外观变化的场景视频流;2)采用深度度量学习框架训练并学习得到特征提取网络;3)利用特征提取网络从训练视频流图像中抽取特征;4)对得到的特征进行迭代聚类,建立词袋树模型;5)在实际机器人定位和导航过程中,输入机器人实时获取的视频流中的当前关键帧;6)利用特征提取网络提取当前关键帧的特征;7)将当前关键帧的特征添加到词袋树模型;8)利用词袋树模型搜索和匹配图像特征相近的图像帧,并进行相似性度量,判断机器人是否遇到回环。本发明能够实现机器人在动态环境中长时间定位和导航过程中的高效的回环检测。
-
公开(公告)号:CN106840166A
公开(公告)日:2017-06-13
申请号:CN201710081020.X
申请日:2017-02-15
Applicant: 北京大学深圳研究生院 , 深圳市银星智能科技股份有限公司
IPC: G01C21/20
Abstract: 本发明公开一种基于词袋树群模型的机器人定位和导航方法。该方法为:1)输入长时间的包含低动态室内场景变化的视频流;2)从视频流图像中离线抽取特征;3)对得到的特征通过k‑means++算法进行聚类;4)对聚类得到的子空间进行迭代聚类;5)对迭代聚类后的特征建立词袋树模型;6)建立词袋树群模型;7)通过统计原理对低动态物体的运动规律进行统计;8)根据词袋树群模型,利用所述运动规律分析确定当前时刻对应的词袋树模型;9)将确定的词袋树模型用于回环检测,实现机器人在低动态环境下的定位和导航。本发明能够在避免使用昂贵的激光传感器情况下,低成本地实现机器人在室内等低动态环境下长时间自主定位和导航。
-
公开(公告)号:CN104021554B
公开(公告)日:2017-03-01
申请号:CN201410252716.0
申请日:2014-06-09
Applicant: 北京大学深圳研究生院
Abstract: 本发明公开了一种基于部分传感器信息的相机-惯性传感器标定方法,首先建立基于部分惯性传感器信息的标定方程,然后通过先恢复惯性传感器缺失的信息,再求解相机-惯性传感器之间的相对坐标变换,对上述基于部分惯性传感器信息的标定方程进行求解,并对标定结果进行了优化。解决了在惯性传感器输出信息不完全条件下相机-惯性传感器标定问题,并且在实际标定环境中,在有观测误差的情形下,设计的优化算法可以最优化最终标定结果,获得一个很好的标定精度。
-
公开(公告)号:CN103854016B
公开(公告)日:2017-03-01
申请号:CN201410119629.8
申请日:2014-03-27
Applicant: 北京大学深圳研究生院
Abstract: 本发明涉及一种基于方向性共同发生特征的人体行为分类识别方法及系统。该方法包括:在视频序列中检测人体目标并提取时空兴趣点;提取HOG和HOF特征,对时空兴趣点聚类;统计具有不同类别标签的时空兴趣点对出现在相同帧时的方向信息;统计方向性时空点对特征直方图,得到针对输入视频的特征描述;将该词袋模型中的直方图特征换成方向性时空点对特征直方图,针对不同类别行为进行训练,得到对应的特征描述;提取得到输入的测试视频的特征描述,与不同类别行为的特征描述模板进行最近邻匹配,匹配度最高的即为该视频对应的行为类别。本发明通过描述局部特征点对之间的方向信息有效提升了人体行为分类和识别的准确率和鲁棒性。
-
公开(公告)号:CN103901400B
公开(公告)日:2016-08-17
申请号:CN201410142777.1
申请日:2014-04-10
Applicant: 北京大学深圳研究生院
IPC: G01S5/18
Abstract: 本发明公开了一种基于时延补偿和双耳一致性的双耳声音源定位方法,分别在时域和频域基于最小化均方误差准则推导出双耳能量差和双耳时间差,利用双耳一致性函数改进了时延估计的精度,在得到双耳定位特征之后,利用贝叶斯分层的搜索策略确定声音源的转向角和俯仰角,即达到定位的目的。首先,双耳一致性函数保证了应用于定位的信号帧为可靠的;其次,时延补偿打破了传统的需要两个独立的算法估计双耳时间差和双耳能量差的局限性,使双耳特征提取的手段更具多样化与普适性(适合多种不同程度地噪声环境);最后,分层的定位系统能够有效地减少特征匹配的次数,降低了算法的时间复杂度,保证了声源定位系统的实时性要求。
-
公开(公告)号:CN103365293B
公开(公告)日:2015-11-18
申请号:CN201310295642.4
申请日:2013-07-15
Applicant: 北京大学深圳研究生院
IPC: G05D1/02
Abstract: 本发明涉及一种基于动态区域划分的机器人安全路径规划方法,其步骤包括:1)在路径空间中随机选择一个采样点作为扩展方向,并选取离该随机采样点路径最短的临近节点;2)根据障碍物占据区域的大小对所述临近节点进行区域划分并建立路径的安全性评价准则,进而确定最优临近节点;3)根据最优临近节点及其区域划分结果选择合适的方式进行路径扩展,生成新的节点并将其添加到扩展树中,逐步生成机器人安全路径。本发明针对复杂可变的未知环境,考虑在多自由度机器人的路径规划中,使路径地图中的节点含有当地局部区域的环境信息,并用这个环境信息指导规划器高效、安全、实时地规划路径。
-
公开(公告)号:CN103901401A
公开(公告)日:2014-07-02
申请号:CN201410143474.1
申请日:2014-04-10
Applicant: 北京大学深圳研究生院
IPC: G01S5/18
CPC classification number: G01S5/18
Abstract: 本发明公开了一种新的基于贝叶斯分层模式的双耳声音源定位方法,首先,可靠频带选择机制保证了选择用于估计双耳时间差的频带是可靠的,提高了时间差的估计精度;其次,利用双耳能量差来缩小第一层得到的候选方向集合;再次,第三层提出了双耳匹配滤波器作为新的双耳定位特征,它描述了双耳信号之间的差异,能够充分表达双耳时间差和双耳能量差之间的关系;最后,针对三层定位过程中搜索空间逐渐缩小,采用贝叶斯决策的准则得到概率最大的方向。这种分层的定位系统能够有效地减少特征匹配的次数,降低了算法的时间复杂度,保证了声源定位系统的实时性要求。
-
公开(公告)号:CN103901400A
公开(公告)日:2014-07-02
申请号:CN201410142777.1
申请日:2014-04-10
Applicant: 北京大学深圳研究生院
IPC: G01S5/18
CPC classification number: G01S5/18
Abstract: 本发明公开了一种基于时延补偿和双耳一致性的双耳声音源定位方法,分别在时域和频域基于最小化均方误差准则推导出双耳能量差和双耳时间差,利用双耳一致性函数改进了时延估计的精度,在得到双耳定位特征之后,利用贝叶斯分层的搜索策略确定声音源的转向角和俯仰角,即达到定位的目的。首先,双耳一致性函数保证了应用于定位的信号帧为可靠的;其次,时延补偿打破了传统的需要两个独立的算法估计双耳时间差和双耳能量差的局限性,使双耳特征提取的手段更具多样化与普适性(适合多种不同程度地噪声环境);最后,分层的定位系统能够有效地减少特征匹配的次数,降低了算法的时间复杂度,保证了声源定位系统的实时性要求。
-
-
-
-
-
-
-
-
-