一种基于语义指导融合的多标签图像分类方法

    公开(公告)号:CN118154938A

    公开(公告)日:2024-06-07

    申请号:CN202410146595.5

    申请日:2024-02-02

    Abstract: 本发明涉及一种基于语义指导融合的多标签图像分类方法,包括:获取待分类图像;将待分类图像输入至多标签图像分类网络,得到多标签图像分类结果;其中,多标签图像分类网络包括:空间特征相关性提取模块,用于从输入图像中提取特征图,并得到空间特征全局相关性的融合特征;语义相关性提取模块,用于根据标签图生成语义局部相关性嵌入,得到语义全局相关性嵌入;语义指导融合模块,用于将融合特征中不同分支的特征分别与语义局部相关性嵌入和语义全局相关性嵌入进行深度融合,得到深度融合局部表征和深度融合全局表征;分类输出模块,用于根据深度融合局部表征和深度融合全局表征得到多标签图像分类结果。本发明能够提高多标签图像分类效果。

    一种基于多路光流信息时间一致性的微光视频增强方法

    公开(公告)号:CN117197194A

    公开(公告)日:2023-12-08

    申请号:CN202311119670.0

    申请日:2023-09-01

    Abstract: 本发明涉及一种基于多路光流信息时间一致性的微光视频增强方法,包括:获取单张视频帧、预测的光流信息和真实的光流信息;将单张视频帧、预测的光流信息和真实的光流信息输入至微光视频增强模型中,得到增强的视频帧图像;其中,微光视频增强模型包括:第一支路网络部分,以单张视频帧为输入,输出预测增强后的单张视频帧图像;第二支路网络部分,以单张视频帧和预测的光流信息为输入,得到第二支路网络输出图像;第三支路网络部分,以单张视频帧和真实的光流信息为输入,得到第三支路网络输出图像。本发明解决时间不稳定性问题,同时无需采用3D卷积模块,减小资源的开销。

Patent Agency Ranking