基于视觉与语言模型的零样本异常检测方法、装置及设备

    公开(公告)号:CN119941644A

    公开(公告)日:2025-05-06

    申请号:CN202411946095.6

    申请日:2024-12-27

    Abstract: 本发明提供了一种基于视觉与语言模型的零样本异常检测方法、装置及设备,涉及异常检测技术领域,所述方法包括:从同一批次图像中获取推理图像和参考图像;通过第一多模态模型,分别对所述推理图像和所述参考图像进行双模态检测,获得初始掩码;通过第二多模态模型分别提取所述同一批次图像的特征并分别进行特征聚合,获得聚合推理特征和聚合参考特征;根据所述初始掩码,对所述聚合参考特征进行噪声特征过滤,获得非异常聚合参考特征,根据所述非异常聚合参考特征和所述聚合推理特征获得初始异常分数;根据所述初始异常分数和所述初始掩码进行掩码精炼,获得最终推理掩码,用于实现零样本异常检测。

    一种基于视觉基础模型驱动的3D高斯泼溅视觉重定位方法

    公开(公告)号:CN119963641A

    公开(公告)日:2025-05-09

    申请号:CN202510019952.6

    申请日:2025-01-07

    Abstract: 本发明公开了一种基于视觉基础模型驱动的3D高斯泼溅视觉重定位方法,包括如下步骤:S1、3D高斯泼溅空间表征构建与高层次特征提取;S2、2D‑3D特征匹配与位姿优化,利用2D‑3D特征匹配方法对初始估计位姿进行调整以获得更精确的位姿,采用关键点稀疏化减少空间和计算资源消耗以提高处理效率和实时性;S3、精确定位结果获取与鲁棒性、计算负担评估,最终获取精确的定位结果,达到环境变化条件下的高鲁棒性,本发明克服现有3D视觉重定位框架适应性差、重定位精度不高及资源占用等较大问题,通过充分利用视觉基础模型的全局特征描述能力,结合3D高斯泼溅技术,实现了在动态环境中具有鲁棒性、可扩展性和高度环境适应性的高精度、实时性视觉重定位。

Patent Agency Ranking