-
公开(公告)号:CN114360042A
公开(公告)日:2022-04-15
申请号:CN202210016006.2
申请日:2022-01-07
Applicant: 桂林电子科技大学
Abstract: 本发明公开了一种人眼注视方向预测方法及系统,包括:获取待测的人眼图片及标定人眼图片;将待测的所述人眼图片与所述标定人眼图片同时输入预先训练的视线预测模型,输出待测的人眼图片中的人眼的注视方向。本发明通过设计差分支路从而缓解了个性化问题,同时提高了对标定图片的标签信息的利用程度。本发明通过残差结构优化描述待预测人眼图片的特征向量,在优化同时,也降低无效图片所造成的误差。
-
公开(公告)号:CN114360042B
公开(公告)日:2024-10-29
申请号:CN202210016006.2
申请日:2022-01-07
Applicant: 桂林电子科技大学
IPC: G06V40/18 , G06N3/0464 , G06N3/08 , G06V10/44 , G06V10/774 , G06V10/82
Abstract: 本发明公开了一种人眼注视方向预测方法及系统,包括:获取待测的人眼图片及标定人眼图片;将待测的所述人眼图片与所述标定人眼图片同时输入预先训练的视线预测模型,输出待测的人眼图片中的人眼的注视方向。本发明通过设计差分支路从而缓解了个性化问题,同时提高了对标定图片的标签信息的利用程度。本发明通过残差结构优化描述待预测人眼图片的特征向量,在优化同时,也降低无效图片所造成的误差。
-
公开(公告)号:CN115761858A
公开(公告)日:2023-03-07
申请号:CN202211509716.5
申请日:2022-11-29
Applicant: 桂林电子科技大学
Abstract: 本申请公开了一种基于人脸外观的注视方向预测方法及系统,方法包括:采集待预测对象的人脸图片,得到原始预测图像;基于所述原始预测图像,裁剪出左眼和右眼的图片,得到人眼预测图像;构建注视方向预测模型;所述人眼预测图像输入至所述注视方向预测模型中,得到人脸注视方向。通过设计自注意力静态模块去融合粗粒度人脸特征和细粒度人眼特征,提高了不同粒度特征的融合程度;通过设计差分动态模块去显式获得动态特征,增强了对原有数据集的动态特征的利用程度。
-
公开(公告)号:CN115761858B
公开(公告)日:2025-05-09
申请号:CN202211509716.5
申请日:2022-11-29
Applicant: 桂林电子科技大学
Abstract: 本申请公开了一种基于人脸外观的注视方向预测方法及系统,方法包括:采集待预测对象的人脸图片,得到原始预测图像;基于所述原始预测图像,裁剪出左眼和右眼的图片,得到人眼预测图像;构建注视方向预测模型;所述人眼预测图像输入至所述注视方向预测模型中,得到人脸注视方向。通过设计自注意力静态模块去融合粗粒度人脸特征和细粒度人眼特征,提高了不同粒度特征的融合程度;通过设计差分动态模块去显式获得动态特征,增强了对原有数据集的动态特征的利用程度。
-
公开(公告)号:CN116503937A
公开(公告)日:2023-07-28
申请号:CN202310487577.9
申请日:2023-05-04
Applicant: 桂林电子科技大学
Abstract: 本发明公开了一种基于人脸外观的深度学习注视预测方法及系统,方法包括:获取待测对象的人脸外观图片;对所述待测对象的人脸外观图片进行处理,提取人脸图片;将所述人脸图片输入训练好的注视预测模型中,预测所述人脸图片中人眼注视方向。本发明通过将卷积神经网络、窗口多头注意力机制和移动窗口多头注意力机制结合,提高了网络的图片局部空间特征学习能力和全局特征建模能力,解决了现有基于视觉变压器的注视预测方法无法多尺度特征学习以及图片全局自注意力计算困难的问题。
-
-
-
-