基于可供性-场景知识提示的人-物交互检测方法及装置

    公开(公告)号:CN118447567A

    公开(公告)日:2024-08-06

    申请号:CN202410457333.0

    申请日:2024-04-16

    摘要: 本发明公开一种基于可供性‑场景知识提示的人‑物交互检测方法及装置,能够提高在现实场景中的识别能力,预测更准确的HOI检测结果。方法包括:(1)构建可供性‑场景知识图谱ASKG;(2)搭建人‑物交互检测模型:在训练阶段,输入为一张RGB图像,第一阶段检测人和物体,识别场景类别和编码原始特征;第二阶段,先验知识嵌入模块编码特定的知识嵌入,实例域适应性融合模块编码实例特征与知识嵌入得到实例感知特征,场景域适应性融合模块编码场景特征与知识嵌入得到场景感知特征,最后经过HOI识别模块输出结果;(3)执行图像的人‑物交互检测。