一种基于多尺度沙漏注意力和多分类多回归损失的头部姿态估计方法

    公开(公告)号:CN117831076A

    公开(公告)日:2024-04-05

    申请号:CN202410014421.3

    申请日:2024-01-04

    Abstract: 本发明公开了一种基于多尺度沙漏注意力和多分类多回归损失的头部姿态估计方法。其特征在于:将头部图像输入到特征提取网络,提取原始图像数据的高级语义信息;采用多尺度沙漏注意力模块聚合多尺度的特征,同时增强浅层细节特征和深度高级语义特征;采用不同细粒度的2、6、18、66和198分类构造多分类多回归损失,较低细粒度的2、6和18分类指导模型去学习更加突出和明显的低级语义特征,而更高细粒度的66和198分类则指导模型去学习类间潜在不明显的细节区别和高级语义特征。本发明提出的头部姿态估计方法能够有效提升模型对不同细粒度特征的提取与整合能力,形成不同尺度的空间特征聚合,降低头部姿态估计的误差。

Patent Agency Ranking