-
公开(公告)号:CN112163480A
公开(公告)日:2021-01-01
申请号:CN202010972882.3
申请日:2020-09-16
Applicant: 北京邮电大学
Abstract: 本发明实施例提供了一种行为识别方法及装置,可以获取包含有目标对象的多个目标视频帧;针对每一目标视频帧,将该目标视频帧输入至预先训练的二维坐标提取网络模型,得到该目标视频帧中各对象的二维图像信息;基于该目标视频帧的深度信息和该目标视频帧中各对象的二维图像信息,以及预先训练的三维坐标提取网络模型,确定该目标视频帧中各对象的三维图像信息;基于多个目标视频帧中各对象的三维图像信息,以及预先训练的行为预测网络模型,确定多个目标视频帧中目标对象的驾驶行为。基于上述处理,可以提高行为识别的准确度。
-
公开(公告)号:CN112163480B
公开(公告)日:2022-09-13
申请号:CN202010972882.3
申请日:2020-09-16
Applicant: 北京邮电大学
IPC: G06V20/59 , G06V20/40 , G06V10/774 , G06V10/764 , G06V10/82 , G06K9/62 , G06N3/04
Abstract: 本发明实施例提供了一种行为识别方法及装置,可以获取包含有目标对象的多个目标视频帧;针对每一目标视频帧,将该目标视频帧输入至预先训练的二维坐标提取网络模型,得到该目标视频帧中各对象的二维图像信息;基于该目标视频帧的深度信息和该目标视频帧中各对象的二维图像信息,以及预先训练的三维坐标提取网络模型,确定该目标视频帧中各对象的三维图像信息;基于多个目标视频帧中各对象的三维图像信息,以及预先训练的行为预测网络模型,确定多个目标视频帧中目标对象的驾驶行为。基于上述处理,可以提高行为识别的准确度。
-