一种基于动态区域划分的机器人安全路径规划方法

    公开(公告)号:CN103365293A

    公开(公告)日:2013-10-23

    申请号:CN201310295642.4

    申请日:2013-07-15

    Inventor: 刘宏 饶凯

    Abstract: 本发明涉及一种基于动态区域划分的机器人安全路径规划方法,其步骤包括:1)在路径空间中随机选择一个采样点作为扩展方向,并选取离该随机采样点路径最短的临近节点;2)根据障碍物占据区域的大小对所述临近节点进行区域划分并建立路径的安全性评价准则,进而确定最优临近节点;3)根据最优临近节点及其区域划分结果选择合适的方式进行路径扩展,生成新的节点并将其添加到扩展树中,逐步生成机器人安全路径。本发明针对复杂可变的未知环境,考虑在多自由度机器人的路径规划中,使路径地图中的节点含有当地局部区域的环境信息,并用这个环境信息指导规划器高效、安全、实时地规划路径。

    基于智能手机平台的打鼾监测和防治方法及系统

    公开(公告)号:CN103251388A

    公开(公告)日:2013-08-21

    申请号:CN201310148053.3

    申请日:2013-04-25

    Abstract: 本发明涉及基于智能手机平台的打鼾监测和防治方法及系统,包括鼾声信号的分析模块、即时干预模块和信息反馈模块。监测和防治方法为:1)建立重度鼾声信号和轻度鼾声信号库,对鼾声信号分别进行预处理提取特征向量,训练重和轻度GMM模板;2)在手机客户端实时录入用户的鼾声信号进行处理,在特定时间窗内对处理完后的鼾声信号进行实时四维特征向量序列提取;3)将实时四维特征向量序列分别与轻度和重度两类鼾声GMM模板进行匹配,似然度最大的类作为识别结果;4)若打鼾程度判定为严重,计算当前时间窗内的最大鼾声间隔时间;5)若最大鼾声间隔超过10S,采用外界刺激制止用户打鼾。本发明能够即时进行外界干预,有效制止用户打鼾。

    一种用于版面分析中的连通区域提取方法及装置

    公开(公告)号:CN101290656A

    公开(公告)日:2008-10-22

    申请号:CN200810067409.X

    申请日:2008-05-23

    Abstract: 本发明公开了一种用于版面分析中的连通区域提取方法及装置,该方法包括如下步骤:对于目标像素p(x,y),定义其邻域N(p)为:N(p)={(x-1,y),(x+1,y),(x,y-1),(x,y+1),(x-1,y-1),(x+1,y-1),(x-1,y+1),(x+1,y+1),(x-4,y),(x-3,y),(x-2,y),(x+2,y),(x+3,y),(x+4,y),(x,y+2),(x,y-2)};对于和目标像素p(x,y)具有相同像素值的任意像素q(i,j),判断q(i,j)是否在邻域N(p)中,若是,则将像素p(x,y)和像素q(i,j)作为同一连通区域进行提取。本发明的方法和装置能大大减少了提取的连通区域的数目,增大了连通区域的面积,降低了后续处理中连通区域合并的计算量和处理复杂度,使后续处理变得简单易行。

    一种基于外观与形态解耦的长时期跨摄像头目标关联方法及系统

    公开(公告)号:CN114092873B

    公开(公告)日:2024-11-05

    申请号:CN202111271643.6

    申请日:2021-10-29

    Inventor: 刘宏 石伟 丁润伟

    Abstract: 本发明涉及一种基于外观与形态解耦的长时期跨摄像头目标关联方法及系统。该方法对输入的训练图像通过人体稠密解析估计和边缘估计提取人体轮廓图像,求取训练图像与人体轮廓图像的残差,得到人体外观图像;利用形态表征模型对人体轮廓图像进行高级语义特征提取,利用外观表征模型对人体外观图像进行高级语义特征提取;利用三元组损失函数和识别损失函数训练外观表征模型和形态表征模型,采用学习的两个表征模型对待查询行人图像和候选行人图像提取形态特征和外观特征,通过计算相似性得分得到跨摄像头场景中的关联目标。本发明不需要采用复杂的对抗学习模型就能提取行人的形态信息,并可避免挖掘涉及隐私的人脸信息及不可靠的行人步态信息。

    协同双通道时频掩码估计任务学习的双耳声源定位方法及系统

    公开(公告)号:CN112731291B

    公开(公告)日:2024-02-20

    申请号:CN202011096916.3

    申请日:2020-10-14

    Abstract: 本发明公开了一种协同双通道时频掩码估计任务学习的双耳声源定位方法及系统。该方法为:1)使用双耳信号的短时傅里叶变换系数作为输入特征;2)使用对数维纳滤波作为目标时频掩码,同时估计双通道对数频谱特征的时频掩码;3)将估计得到的时频掩码与对数频谱特征相乘,得到增强后的对数频谱特征;4)利用增强后的对数频谱特征及相位谱特征作为输入,估计声源的方位角;5)利用两阶段训练模式,在初步训练好的双通道时频掩码估计网络和声源定位网络之间建立端到端的联系,微调所有网络参数。本发明能够利用卷积神经网络同时估计双通道时频掩码,提升定位特征的鲁棒性,并且利用时频掩码增强后的定位特征实现有效的端到端的声源定位。

    一种基于图和注意力交织的三维人体姿态估计方法及系统

    公开(公告)号:CN116129051A

    公开(公告)日:2023-05-16

    申请号:CN202310074209.1

    申请日:2023-02-07

    Abstract: 本发明涉及一种基于图和注意力交织的三维人体姿态估计方法及系统。该系统通过预训练的二维姿态检测器从图像特征中提取人体的二维骨架信息;将二维骨架嵌入到高维空间;利用图和注意力交织的网络模块挖掘骨架的局部和全局信息;利用U型结构的多层感知机模块捕获骨架的多层次信息;利用回归头模块将高维数据回归到三维骨架;利用关节点的平均误差作为模型训练的损失函数。本发明结合了图卷积和注意力机制在捕获骨架的局部和全局信息上的优势,允许图卷积模块和注意力模块之间双向通信以优势互补,可有效加强模型对人体骨架的建模能力,能够估计得到更接近真实三维姿态的结果。

    一种基于几何约束全局相干场和视觉引导的说话人声源定位方法和系统

    公开(公告)号:CN116087878A

    公开(公告)日:2023-05-09

    申请号:CN202310147501.1

    申请日:2023-02-02

    Abstract: 本发明涉及一种基于几何约束全局相干场和视觉引导的说话人声源定位方法和系统。该方法包括:采用相机几何模型提取几何约束全局相干场线索,以表示声源信号的空间特征;根据与音频信号同步的视频帧的图片样本中的说话人位置标注,生成视觉引导的二值化伪标签;采用卷积神经网络结合全连接网络构成声学网络,声学网络利用几何约束全局相干场线索生成声学位置图谱,计算声学位置图谱与生成的伪标签的均方误差来训练声学网络;采用训练好的声学网络生成声学位置图谱,根据声学位置图谱中的峰值位置确定说话人声源的位置坐标。本发明利用视觉模态和听觉模态之间的互补性和一致性,增强了声学网络对于声源位置的学习能力,能够实现准确的声源定位。

    基于对比学习和对抗训练的行人重识别方法及装置

    公开(公告)号:CN115862055A

    公开(公告)日:2023-03-28

    申请号:CN202211431557.1

    申请日:2022-11-15

    Inventor: 刘宏 石邢越

    Abstract: 本发明公开了一种基于对比学习和对抗训练的行人重识别方法及装置,所述方法不仅设计了一基础模块,还利用对比学习和对抗训练的思想设计了视角混淆模块和身份原型模块。视角混淆模块利用对比学习的思想进行训练,并可借助视角判别器的梯度反转层,使基础模块的特征提取器获得混淆视角差异的能力。身份原型模块根据置信度取加权平均值作为身份原型,从而聚拢相同身份的样本特征的在特征空间中的分布。在视角混淆模块和身份原型模块的促进下,本发明提升了行人重识别性能。

    一种基于时空信息聚合的对比自监督人体行为识别方法及系统

    公开(公告)号:CN115019397A

    公开(公告)日:2022-09-06

    申请号:CN202210680841.6

    申请日:2022-06-15

    Abstract: 本发明涉及一种基于时空信息聚合的对比自监督人体行为识别方法及系统。该方法对输入的骨架动作序列进行数据增强得到增强后的两个动作序列;利用第一编码器和第二编码器即动量更新编码器将其编码成特征向量;利用预测器得到另一组特征向量,通过损失函数构造有效的单个数据流的特征空间。进一步地,计算骨架序列的运动信息和骨骼信息,并同样作为上述步骤的输入,并在得到特征之后计算特征相似度,数据流内部的相似度矩阵做尖锐处理,并在不同数据流间投票融合,得到相似度伪标签,将时空信息有效聚合后约束单个数据流的分布,来训练更优的模型。本发明训练得到的模型可以在实际应用中取得很好的行为识别效果。

Patent Agency Ranking