-
公开(公告)号:CN117901126A
公开(公告)日:2024-04-19
申请号:CN202311373787.1
申请日:2023-10-23
Applicant: 北京工业大学
Abstract: 本发明提供一种仿人机器人动态感知方法及计算系统,针对仿人机器人的室内外复杂环境下的环境感知中现有技术中存在室内外环境感知精度低以及路径复杂场景下导航路径规划无法满足仿人机器人的运动学约束的问题,设计了一种仿人机器人环境感知计算单元的设计方案,并基于此感知计算单元设计一套可用于仿人机器人室内外复杂环境下的同步定位建图与导航方案。利用本方法可以实现高精度高效率的仿人机器人多模态传感器获取复杂环境感知数据,从而为仿人机器人执行任务提供基本保障。
-
公开(公告)号:CN115952312A
公开(公告)日:2023-04-11
申请号:CN202211539530.4
申请日:2022-12-02
Applicant: 北京工业大学
IPC: G06F16/583 , G06F16/58 , G06V10/26 , G06V10/46
Abstract: 本发明提供一种图像标签的自动标注与排序方法,包括以下步骤:构建基准图像集;对无标签的测试图像进行标注;对测试图像的标签进行排序。本发明提出了一种图像标签的自动标注和排序方法,一方面,通过基准图像集得到标签和视觉词的对应关系,实现测试图像标签的自动标注;另一方面,图像的对象性检测结果具有很强的语义性,将对象性检测技术用于标签排序,排序后的标签带有的语义信息和图像反映出的语义信息一致性更强,更准确的标签信息能够更好的用于图像检索等其他视觉任务,同时也能够为研究提供海量的可靠训练样本。
-
公开(公告)号:CN118966883A
公开(公告)日:2024-11-15
申请号:CN202411017578.8
申请日:2024-07-29
Applicant: 北京工业大学
IPC: G06Q10/0639 , B60W50/00 , B60W40/00 , G06F17/16 , G06F17/18 , G06N3/0464 , G06N3/042 , G06N3/08
Abstract: 本发明提供一种对无人驾驶交互认知能力的评估方法,包括确定无人驾驶交互认知能力维度集,还包括以下步骤:确定无人驾驶交互认知能力评估对象集;计算无人驾驶交互认知综合评估得分C。本发明提出了一种对无人驾驶交互认知能力的评估方法,可以同时考虑指标间的内在相关性和非线性特征,能够有效评估在复杂的、多指标的无人驾驶交互认知能力。
-
公开(公告)号:CN117670955A
公开(公告)日:2024-03-08
申请号:CN202311670013.5
申请日:2023-12-07
Applicant: 北京工业大学
Abstract: 本发明提供一种应用于双足仿人机器人的跨模态点云精配准方法,包括获取参考点云和待配准点云并提取超点 和匹配点 对匹配点根据超点进行维罗尼分解,构建局部点集 构建基于几何位置编码的注意力机制模块,计算超点 的混合特征并以此进行超点 之间的匹配,获得超点对应关系进行局部点集内局部密集点间的匹配,获得全局密集点对应求解点关联度计算得到的和的变换关系根据局部点集 约束建立匹配点 精配准点对关系根据候选匹配的置信度矩阵wij加权计算最优变换;进行精配准优化,得到最终配准变换矩阵
-
公开(公告)号:CN115952312B
公开(公告)日:2024-07-19
申请号:CN202211539530.4
申请日:2022-12-02
Applicant: 北京工业大学
IPC: G06F16/583 , G06F16/58 , G06V10/26 , G06V10/46
Abstract: 本发明提供一种图像标签的自动标注与排序方法,包括以下步骤:构建基准图像集;对无标签的测试图像进行标注;对测试图像的标签进行排序。本发明提出了一种图像标签的自动标注和排序方法,一方面,通过基准图像集得到标签和视觉词的对应关系,实现测试图像标签的自动标注;另一方面,图像的对象性检测结果具有很强的语义性,将对象性检测技术用于标签排序,排序后的标签带有的语义信息和图像反映出的语义信息一致性更强,更准确的标签信息能够更好的用于图像检索等其他视觉任务,同时也能够为研究提供海量的可靠训练样本。
-
公开(公告)号:CN116631059A
公开(公告)日:2023-08-22
申请号:CN202310600840.0
申请日:2023-05-25
Applicant: 北京工业大学
IPC: G06V40/20 , G06V10/46 , G06V10/764 , G06N3/0464 , G06N3/08 , G06V10/82 , G06V10/62 , G06V10/52 , G06V10/22 , G10L25/51 , G10L25/30
Abstract: 本发明公开了一种声像联合的跨模态声源定位与手势识别方法,该方法的具体实施过程如下:步骤1.建立空间极坐标系;步骤2.将三维空间划分为不同的子空间;步骤3.音频信息预处理;步骤4.卷积神经网络模型;步骤5.使用YOLOv7进行人体检测;步骤6.使用AlphaPose提取手势的骨骼信息;步骤7.使用时空图卷积网络进行手势识别;通过音频信息精准定位指令发起者的位置,然后通过视觉信息识别指令发起者的手势,从而完成相应的指令。
-
-
-
-
-
-