-
公开(公告)号:CN117877122B
公开(公告)日:2024-12-17
申请号:CN202410162484.3
申请日:2024-02-05
Applicant: 北京理工大学珠海学院
IPC: G06V40/20 , G06T3/4053 , G06V10/764 , G06V10/774 , G06V10/80 , G06T3/4038 , G06N3/0464 , G06N3/0455 , G06N3/0442 , G06N3/08
Abstract: 本发明提供一种基于轻量型ViT和注意力机制的红外人体姿态估计方法,其包括获取红外图像数据;构建MSF‑MobileViT网络模型,通过MSF‑MobileViT网络模型提取得到红外图像数据的高分辨率且语义信息丰富的特征表示;构建DAs‑MPPE网络模型,通过DAs‑MPPE网络模型生成L来编码肢体之间的关联度,再生成S来预测关节点的位置;在两个网络模型的协同训练过程中,采用一致性和置信度评估两种评估标准,多次输出选取可信度高的无标签数据纳入对方网络的训练集中,稳定的选取无标签数据添加伪标签。本发明将MSF‑MobileViT网络模型和DAs‑MPPE网络模型结合进行红外人体姿态估计,从而定位图像中所有人的关节点和肢体位置,有效克服了现有红外人体行为识别技术中存在的弊端。
-
公开(公告)号:CN117877122A
公开(公告)日:2024-04-12
申请号:CN202410162484.3
申请日:2024-02-05
Applicant: 北京理工大学珠海学院
IPC: G06V40/20 , G06T3/4053 , G06V10/764 , G06V10/774 , G06V10/80 , G06T3/4038 , G06N3/0464 , G06N3/0455 , G06N3/0442 , G06N3/08
Abstract: 本发明提供一种基于轻量型ViT和注意力机制的红外人体姿态估计方法,其包括获取红外图像数据;构建MSF‑MobileViT网络模型,通过MSF‑MobileViT网络模型提取得到红外图像数据的高分辨率且语义信息丰富的特征表示;构建DAs‑MPPE网络模型,通过DAs‑MPPE网络模型生成L来编码肢体之间的关联度,再生成S来预测关节点的位置;在两个网络模型的协同训练过程中,采用一致性和置信度评估两种评估标准,多次输出选取可信度高的无标签数据纳入对方网络的训练集中,稳定的选取无标签数据添加伪标签。本发明将MSF‑MobileViT网络模型和DAs‑MPPE网络模型结合进行红外人体姿态估计,从而定位图像中所有人的关节点和肢体位置,有效克服了现有红外人体行为识别技术中存在的弊端。
-