-
公开(公告)号:CN118154938A
公开(公告)日:2024-06-07
申请号:CN202410146595.5
申请日:2024-02-02
Applicant: 中国科学院上海微系统与信息技术研究所
IPC: G06V10/764 , G06V10/80 , G06V10/44 , G06V10/774 , G06V10/82 , G06N3/0464
Abstract: 本发明涉及一种基于语义指导融合的多标签图像分类方法,包括:获取待分类图像;将待分类图像输入至多标签图像分类网络,得到多标签图像分类结果;其中,多标签图像分类网络包括:空间特征相关性提取模块,用于从输入图像中提取特征图,并得到空间特征全局相关性的融合特征;语义相关性提取模块,用于根据标签图生成语义局部相关性嵌入,得到语义全局相关性嵌入;语义指导融合模块,用于将融合特征中不同分支的特征分别与语义局部相关性嵌入和语义全局相关性嵌入进行深度融合,得到深度融合局部表征和深度融合全局表征;分类输出模块,用于根据深度融合局部表征和深度融合全局表征得到多标签图像分类结果。本发明能够提高多标签图像分类效果。
-
公开(公告)号:CN117197194A
公开(公告)日:2023-12-08
申请号:CN202311119670.0
申请日:2023-09-01
Applicant: 中国科学院上海微系统与信息技术研究所
IPC: G06T7/269 , G06V10/20 , G06N3/0464 , G06N3/09
Abstract: 本发明涉及一种基于多路光流信息时间一致性的微光视频增强方法,包括:获取单张视频帧、预测的光流信息和真实的光流信息;将单张视频帧、预测的光流信息和真实的光流信息输入至微光视频增强模型中,得到增强的视频帧图像;其中,微光视频增强模型包括:第一支路网络部分,以单张视频帧为输入,输出预测增强后的单张视频帧图像;第二支路网络部分,以单张视频帧和预测的光流信息为输入,得到第二支路网络输出图像;第三支路网络部分,以单张视频帧和真实的光流信息为输入,得到第三支路网络输出图像。本发明解决时间不稳定性问题,同时无需采用3D卷积模块,减小资源的开销。
-
公开(公告)号:CN117544258A
公开(公告)日:2024-02-09
申请号:CN202311756917.X
申请日:2023-12-19
Applicant: 中国科学院上海微系统与信息技术研究所
IPC: H04B17/382 , H04L27/00
Abstract: 本发明涉及一种基于主成分估计的欠奈奎斯特采样结构的宽频带感知方法,包括以下步骤:利用MWC采样结构作为前端构建基本信号模型;采用CTF模块构造欠采样框架V,利用欠采样框架V对MMV问题的进行求解,得到宽频带信号的支撑集合;其中,求解时进行循环误差检测,当循环次数达到预设目标时停止更新迭代过程,循环误差检测时采用主成分估计得到每次更新的误差;根据宽频带信号的支撑集合输出频谱感知结果。本发明能够提升感知准确度。
-
公开(公告)号:CN117237704A
公开(公告)日:2023-12-15
申请号:CN202311096102.3
申请日:2023-08-29
Applicant: 中国科学院上海微系统与信息技术研究所
IPC: G06V10/764 , G06V10/44 , G06V10/82 , G06V10/80 , G06N3/042 , G06N3/0464 , G06N3/045 , G06N3/08
Abstract: 本发明涉及一种基于二维依赖性的多标签图像分类方法,包括:接收待分类图像;将所述待分类图像输入至二维依赖性模型,得到图像分类结果;其中,二维依赖性模型包括空间特征依赖模块和标签语义依赖模块;空间特征依赖模块包括特征提取部分、特征融合部分、特征增强部分和输出部分;所述标签语义依赖模块包括GCN网络部分和全局关系增强部分。本发明解决了固定卷积核感受野受限、以及标签关系提取不足的问题。
-
-
-