一种基于自监督学习的单目RGB图像手势重建方法及系统

    公开(公告)号:CN117315137A

    公开(公告)日:2023-12-29

    申请号:CN202311137288.2

    申请日:2023-09-05

    Applicant: 武汉大学

    Abstract: 本发明公开了一种基于自监督学习的单目RGB图像手势重建方法及系统,首先从RGB图像和视频中提取2D人手关键点检测结果,作为伪标签;然后改进参数化人手模型,注入符合人手运动学规律的姿态先验;接着构建3D人手重建网络和2D关键点检测器网络;最后针对图像和视频训练数据以及的2D关键点伪标签,对3D人手重建网络和可训练的2D关键点检测器设置自监督信号,训练手势估计网络,基于训练结果实现单目RGB图像手势重建。本发明解决了单目RGB图像手势姿态估计,光照纹理估计,自监督信号提取等难点问题。具有可使用广泛的无标签图像和视频数据,精度高,效率高,泛化性强使用面广等优点。

    基于条件生成网络的高仿真地空影像匹配方法及系统

    公开(公告)号:CN117372524A

    公开(公告)日:2024-01-09

    申请号:CN202311422373.3

    申请日:2023-10-31

    Applicant: 武汉大学

    Abstract: 本发明提供一种基于条件生成网络的高仿真地空影像匹配定位方法及系统,包括使用全局对准算法对输入图片进行数据预处理;预处理后的图像导入第一个条件生成网络生成跨视图图像,采用的生成器网络命名为G1;将生成器G1输出的合成图像输入第二个条件生成网络,并在同一视图中合成分割图,采用的生成器网络记为G2,根据其功能命名为分割器;将G1与G2同时进行网络训练;针对G1与G2分别构建鉴别器网络D1、D2;在跨视角数据集平台上训练G1、G2、D1以及D2网络;基于跨视角数据集平台,根据具体应用场景和领域构建对应子数据集,对网络参数进行微调;对输入摄街景图片,利用前述步骤中训练完成的网络进行检索,实现对输入图片的地理定位。

Patent Agency Ranking