-
公开(公告)号:CN117809339A
公开(公告)日:2024-04-02
申请号:CN202410014783.2
申请日:2024-01-04
Applicant: 桂林电子科技大学
Abstract: 本发明公开了一种基于可变形卷积编码网络和特征区域关注的人体姿态估计方法。所述方法包括如下步骤:1)提取输入图像序列的视觉特征;2)特征序列融合的增强全局视觉特征;3)自适应区域特征;4)通道和空间的特征信息表示;5)生成姿态点热力图。本发明提出的一种基于可变形卷积编码网络和特征区域关注的人体姿态估计方法,能促进网络对特征区域的区分能力和对有效特征区域的关注,从而减少对错误特征区域的识别,提升网络的精准度。
-
公开(公告)号:CN117831076A
公开(公告)日:2024-04-05
申请号:CN202410014421.3
申请日:2024-01-04
Applicant: 桂林电子科技大学
IPC: G06V40/10 , G06V10/44 , G06V10/764 , G06V10/766 , G06V10/82 , G06T7/73 , G06N3/045 , G06N3/0464 , G06N3/08
Abstract: 本发明公开了一种基于多尺度沙漏注意力和多分类多回归损失的头部姿态估计方法。其特征在于:将头部图像输入到特征提取网络,提取原始图像数据的高级语义信息;采用多尺度沙漏注意力模块聚合多尺度的特征,同时增强浅层细节特征和深度高级语义特征;采用不同细粒度的2、6、18、66和198分类构造多分类多回归损失,较低细粒度的2、6和18分类指导模型去学习更加突出和明显的低级语义特征,而更高细粒度的66和198分类则指导模型去学习类间潜在不明显的细节区别和高级语义特征。本发明提出的头部姿态估计方法能够有效提升模型对不同细粒度特征的提取与整合能力,形成不同尺度的空间特征聚合,降低头部姿态估计的误差。
-