-
公开(公告)号:CN103226835B
公开(公告)日:2016-01-27
申请号:CN201310130189.1
申请日:2013-04-15
Applicant: 北京大学深圳研究生院
IPC: G06T7/20
Abstract: 本发明涉及一种基于在线初始化梯度增强回归树的目标跟踪方法及系统,在视频输入端、跟踪目标输出端以及在线训练分类器构成的系统中,方法步骤为:1)在视频序列中选择跟踪目标,提取类Haar特征的正负样本;2)根据所述正负样本随机建立在线分类器得到训练残差;3)将所述训练残差作为在线分类器的训练样本进行训练修正,建立目标模型;4)从下一帧视频图像获取图像置信图,目标窗口确定置信值最大的位置,完成跟踪。本发明使得其能够快速收敛到最优点,完成对随机森林检测的优化,并且通过在线学习实现分类器的更新,很好地解决了目标外观变化、快速运动以及遮挡等问题。
-
公开(公告)号:CN103278164B
公开(公告)日:2015-11-18
申请号:CN201310233773.X
申请日:2013-06-13
Applicant: 北京大学深圳研究生院
Abstract: 本发明涉及一种复杂动态场景下机器人仿生路径规划方法,以及实现该方法的机器人运动规划仿真平台。该方法根据碰撞可能性和到达可能性建立路径安全性衡量准则,采用两层交互路径规划的算法框架,将运动规划分为环境探索层和局部路径规划层,两层之间利用一个自适应的路径缓冲区来进行信息交互,将安全性更新搜索树作为顶层规划器,应用到两层交互框架中的环境探索层。该仿真平台包括问题模块、规划模块和执行模块。本发明仿照人类路径选取的路径规划策略,提出了一种安全、实时的路径规划方案,克服了现有技术仅考虑路径可行性而没有关注路径持续性的不足,实现了机器人在复杂动态环境中的运动规划。
-
公开(公告)号:CN104240720A
公开(公告)日:2014-12-24
申请号:CN201310252634.1
申请日:2013-06-24
Applicant: 北京大学深圳研究生院
Abstract: 本发明公开了一种基于多重分形和信息融合的语音情感识别方法,本方法为:1)从语音库中提取语音样本数据,建立一语音样本训练集合和一语音样本测试集合;2)利用所选非线性特征从语音样本训练集合中提取用于语音情感识别的非线性特征值;非线性特征包括:语音信号多重分形谱,语音信号广义hurst指数;3)对语音样本训练集合进行预处理,然后将非线性特征值作为各弱分类器的输入,对每一弱分类器进行训练;4)将训练后的各弱分类器集成为一强分类器,然后利用语音样本测试集合中语音样本信号对该强分类器进行测试;5)利用测试后的强分类器对新语音信号进行分类,识别出语音信号对应的情感类别。本发明大大提高了语音信号识别的准确性。
-
公开(公告)号:CN103413154A
公开(公告)日:2013-11-27
申请号:CN201310385267.2
申请日:2013-08-29
Applicant: 北京大学深圳研究生院
IPC: G06K9/66
Abstract: 本发明涉及一种基于归一化类谷歌量度矩阵的人体运动识别方法,步骤为:1)提取人体运动视频中的兴趣点,基于3D时空坐标对每个兴趣点的周围局部区域进行局部描述,得到兴趣点子块的3D-SIFT局部运动特征值;2)根据3D-SIFT局部运动特征值对子块进行特征聚类得到多类特征;3)根据不同类特征进行空间归一化类谷歌量度和时间归一化类谷歌量度计算,并配组得到归一化类谷歌量度关系矩阵;4)将归一化类谷歌量度关系矩阵和词袋法局部特征统计直方图训练得到分类器,对人体运动进行识别。本发明增强了运动特征的统计描述能力,弱化局部特征或者子动作较为类似的运动类别间的类间混淆性,提高了复杂环境视频中的人体运动识别效率。
-
公开(公告)号:CN103310454A
公开(公告)日:2013-09-18
申请号:CN201310239290.0
申请日:2013-06-17
Applicant: 北京大学深圳研究生院
IPC: G06T7/00
Abstract: 本发明涉及一种滞留物检测中的静止物体类型判断与物主分析方法及系统,系统输入:静止物体图像,输入前景物体图像,以及该帧图像的帧信息和前景物体在图像中的位置和大小信息,输出:静止物体是否是滞留物,如果是滞留物,返回携带者的信息。步骤包括:1)建立背景模型并检测出每帧图像前景物体,根据前景物体生成物体分类器;2)将静止的前景物体输入到物体分类器根据分类器返回的置信值的平均值判断得到静止前景物体类型为物品或者人体;3)对静止前景类型为物品的物体进行物主分析,得到物品的携带者信息,判断出物主。本发明有效地区分了场景中的静止的人与物品,当判断静止物体类型是物品的情况下,可以立即反馈物品携带者的信息。
-
公开(公告)号:CN103226835A
公开(公告)日:2013-07-31
申请号:CN201310130189.1
申请日:2013-04-15
Applicant: 北京大学深圳研究生院
IPC: G06T7/20
Abstract: 本发明涉及一种基于在线初始化梯度增强回归树的目标跟踪方法及系统,在视频输入端、跟踪目标输出端以及在线训练分类器构成的系统中,方法步骤为:1)在视频序列中选择跟踪目标,提取类Haar特征的正负样本;2)根据所述正负样本随机建立在线分类器得到训练残差;3)将所述训练残差作为在线分类器的训练样本进行训练修正,建立目标模型;4)从下一帧视频图像获取图像置信图,目标窗口确定置信值最大的位置,完成跟踪。本发明使得其能够快速收敛到最优点,完成对随机森林检测的优化,并且通过在线学习实现分类器的更新,很好地解决了目标外观变化、快速运动以及遮挡等问题。
-
公开(公告)号:CN119722730A
公开(公告)日:2025-03-28
申请号:CN202411591535.0
申请日:2024-11-08
Applicant: 北京大学深圳研究生院
Abstract: 本发明属于计算机视觉领域,涉及一种面向时空拓扑建模的实时三维人体姿态估计方法和装置。该方法包括:利用对比学习范式进行无标签的预训练,提取人体拓扑结构先验信息;以轻量化的时空人体拓扑提取网络作为编码器,利用人体拓扑结构先验信息,采用双流结构分别并行提取时间域中的人体运动学拓扑关系和空间域中的人体几何拓扑关系;将时间域中的人体运动学拓扑关系和空间域中的人体几何拓扑关系进行累加操作,并通过线性回归得到人体三维姿态的位置并输出相应的三维骨架坐标。本发明能够精确地捕捉人体结构和运动学拓扑特征,能够实现高效准确的三维人体姿态估计。
-
公开(公告)号:CN118365781A
公开(公告)日:2024-07-19
申请号:CN202410434606.X
申请日:2024-04-11
Applicant: 北京大学深圳研究生院
Abstract: 本发明涉及一种基于逆运动学的轻量三维人体网格重建的方法和系统。该方法的步骤包括:利用二维姿态检测器,提取输入图像中人体的二维关节位置;将二维关节坐标投影到特征空间,得到关节特征;将关节特征输入到沙漏型Transformer网络,估计三维关节,构成人体骨架;将不同拓扑结构的三维骨架统一到SMPL的拓扑结构;利用逆运动学将三维关节的坐标位置转换为相对旋转,作为人体模型的姿态参数;将三维骨架输入多层感知机,估计人体的体型参数;将姿态和体型参数输入SMPL网格回归器,得到三维人体网格。本方法通过设计轻量的沙漏型结构网络和基于逆运动学求解姿态参数,有效降低了模型的计算量和参数量,同时提高了人体重建精度,更适用于真实场景的应用。
-
公开(公告)号:CN117576787B
公开(公告)日:2024-04-16
申请号:CN202410060569.0
申请日:2024-01-16
Applicant: 北京大学深圳研究生院
Abstract: 本申请公开了一种基于主动跟踪和自适应手势识别的交接方法、装置及设备,方法包括通过机器人安装的深度相机采集视频图像;基于视频图像通过媒体管道获取相机坐标系下的第一手部地标;将第一手部地标转换至预设的世界坐标系以得到第二手部地标;将第二手部地标输入经过训练的手势识别模型,通过手势识别模型确定所述视频图像对应的用户手势;通过机器人将交互对象交互给用户。本申请实施例通过使用包括媒体管道提示手部地标和通过手势识别模型识别用户手势的两阶段方法,在面对不同物体和不同照明条件时均能准确识别到用户手势,提高了人机交互的准确性,确保了与人类抓握一致的平稳和自然的交接过程。
-
公开(公告)号:CN109239665B
公开(公告)日:2022-04-15
申请号:CN201810752391.0
申请日:2018-07-10
Applicant: 北京大学深圳研究生院
IPC: G01S5/18
Abstract: 本发明公开一种基于信号子空间相似度谱和粒子滤波器的多声源连续定位方法和装置。本方法采用一种时频域加权机制选择单声源主导时频带,避免了多声源定位中出现的声源相互影响的问题,一定程度上抑制混响噪声影响;利用空间相关矩阵主特征向量包含的声源方向信息,构建局部信号子空间相似度谱,可以有效地反映声源的位置信息;采用局部谱分配方法综合多个时频带得到半局部谱,并采用粒子滤波器考虑帧间连续信息对声源进行跟踪,进一步提升了连续定位的准确性。本发明的优势在于为实际应用中多移动声源同时发声的声学场景提供了一种有效的声源定位思路。
-
-
-
-
-
-
-
-
-