-
公开(公告)号:CN116912807A
公开(公告)日:2023-10-20
申请号:CN202310917593.7
申请日:2023-07-25
Applicant: 中国科学院软件研究所
IPC: G06V20/59 , G06V40/16 , G06V40/18 , G06V10/762 , G06V10/82 , G06V10/774 , G06T7/73
Abstract: 本发明公开了一种基于内嵌三维参数的驾驶员注视区域估计方法及装置。所述方法包括:计算数据集中驾驶员面部图像的面部深度信息,所述驾驶员面部图像由位于不同位置的摄像装置拍摄得到;计算数据集中驾驶员面部图像的背景信息聚簇,并基于聚簇结果为驾驶员面部图像分配一伪标签;基于驾驶员面部图像、驾驶员面部图像的面部深度信息以及驾驶员面部图像的伪标签对一内嵌三维参数的神经网络进行训练,得到注视区域估计模型;将待测图像、待测图像的面部深度信息以及待测图像的伪标签输入注视区域估计模型,得到待测图像中驾驶员的注视区域和相机位置。本发明有效保证驾驶员注视区域估计的准确性的同时,可以对不同车型和不同的相机位置进行自适应。