-
公开(公告)号:CN118447567A
公开(公告)日:2024-08-06
申请号:CN202410457333.0
申请日:2024-04-16
申请人: 北京工业大学
IPC分类号: G06V40/20 , G06V10/764 , G06V20/70 , G06V10/80 , G06N5/022
摘要: 本发明公开一种基于可供性‑场景知识提示的人‑物交互检测方法及装置,能够提高在现实场景中的识别能力,预测更准确的HOI检测结果。方法包括:(1)构建可供性‑场景知识图谱ASKG;(2)搭建人‑物交互检测模型:在训练阶段,输入为一张RGB图像,第一阶段检测人和物体,识别场景类别和编码原始特征;第二阶段,先验知识嵌入模块编码特定的知识嵌入,实例域适应性融合模块编码实例特征与知识嵌入得到实例感知特征,场景域适应性融合模块编码场景特征与知识嵌入得到场景感知特征,最后经过HOI识别模块输出结果;(3)执行图像的人‑物交互检测。
-
公开(公告)号:CN118968063A
公开(公告)日:2024-11-15
申请号:CN202411023864.5
申请日:2024-07-29
申请人: 北京工业大学
IPC分类号: G06V10/26 , G06V10/74 , G06V10/764 , G06V10/80 , G06V10/774 , G06N3/0455 , G06N3/0464 , G06N3/0499 , G06N3/048 , G06N3/098
摘要: 本发明公开一种基于物体形状掩膜提示的开放词汇可供性分割方法及装置,能够解决复杂场景中对象相邻部件像素之间的干扰、小尺寸对象分割以及无法推广到开放世界的问题。方法包括:(1)生成物体形状掩膜提示;(2)掩膜提示特征增强;(3)可供性预测。
-