-
公开(公告)号:CN114494791A
公开(公告)日:2022-05-13
申请号:CN202210353591.5
申请日:2022-04-06
Applicant: 之江实验室
IPC: G06V10/764 , G06V10/774 , G06V10/82 , G06K9/62 , G06N3/04 , G06N3/08
Abstract: 本发明提出了一种基于注意力选择的transformer运算精简方法,在transformer网络的每层用注意力机制获取关联矩阵,对关联矩阵的每一行计算信息熵,获得各个局部标识对于网络任务的重要性程度,将局部标识划分为重要标识和不重要标识,每间隔一定网络层,计算不重要标识的特征参数和,将不重要标识的特征参数值加到重要标识上,删除不重要标识,仅重要标识进入网络下一层。网络训练过程中,构建交叉熵损失函数和重要性损失函数,重要性损失函数用于降低重要标识与不重要标识的关联。本发明方法从影响网络任务的判别性区域的选择角度出发,实现方法简单,有效减少网络计算量的同时,对模型精度影响很小,且可以与已知网络压缩方法同时使用,共同实现计算量压缩。
-
公开(公告)号:CN114332544A
公开(公告)日:2022-04-12
申请号:CN202210244194.4
申请日:2022-03-14
Applicant: 之江实验室
IPC: G06V10/764 , G06V10/774 , G06K9/62
Abstract: 本发明公开了一种基于图像块评分的细粒度图像分类方法和装置,包括以下步骤:步骤S1:构建分类数据集;步骤S2:构建局部标识;步骤S3:构建分类标识;步骤S4:获得图像分类特征信息和各个图像块特征信息;步骤S5:构建关联性局部标识;步骤S6:生成选择标识;步骤S7:特征处理;步骤S8:训练;步骤S9:将所述全局标识和所述关联性局部标识拼接,训练最后一个transformer层。本发明解决类内差异大、类间相似程度高的细粒度图像分类的问题,实现在transformer网络中即插即用,效果提升明显。
-
公开(公告)号:CN114154648A
公开(公告)日:2022-03-08
申请号:CN202210124656.9
申请日:2022-02-10
Applicant: 之江实验室
IPC: G06N20/00
Abstract: 本发明涉及模型压缩领域,尤其涉及一种基于网络深度压缩的模型蒸馏方法、装置和介质,该方法使用余弦距离计算不同数据经过模型后的特征关系,基于斯皮尔曼相关公式构建损失函数,将简单模型不同层特征关系与复杂模型最后一层的特征关系进行匹配,并以此构建损失函数,引导简单模型不同层的数据特征关系向复杂模型最深层的数据特征关系靠近,使简单模型的浅层学习到更深层特征信息,从而实现网络深度的压缩。相较于大部分已有知识蒸馏方法主要应用于教师网络和学生网络相近深度的网络层,本发明方法考虑深度对网络提升的影响,直接进行浅层向深层的蒸馏学习,且本发明方法实现方法简便,效果提升显著,并可以与已有知识蒸馏方法同时使用提升效果。
-
公开(公告)号:CN113516207B
公开(公告)日:2022-01-25
申请号:CN202111059448.7
申请日:2021-09-10
Applicant: 之江实验室
Abstract: 本发明公开了一种带噪声标签的长尾分布图像分类方法,通过样本依赖的松弛间隔损失进行学习,并辅以抗噪声的数据增强策略,用于解决同时具有长尾特征与噪声标签的图像分类问题。根据数据噪声特征,在计算样本函数间隔时引入样本依赖的松弛变量以放宽间隔约束,再根据样本间隔分类计算样本依赖的光滑松弛损失;根据数据长尾特征,实施分阶段调整的数据增强策略,对样本分别进行强增强和弱增强,并在正式训练阶段提供基于松弛损失的样本筛选机制用于筛除噪声数据。本发明实现方法简便,手段灵活,在长尾数据、噪声数据以及同时具有二者特征的训练数据上都取得显著的分类效果的提升。
-
公开(公告)号:CN113537072A
公开(公告)日:2021-10-22
申请号:CN202110811913.1
申请日:2021-07-19
Abstract: 本发明属于计算机视觉技术领域,具体为一种基于参数硬共享的姿态估计与人体解析联合学习系统。该系统分为多尺度特征提取模块、联合学习模块、人体解析分支和姿态估计分支四个部分。输入图像首先经过多尺度特征提取模块得到不同尺度下的图像特征,并进行跨尺度的特征融合;再将各尺度的特征分别送入联合学习模块,得到姿态估计与人体解析的联合特征;最后将姿态估计与人体解析的联合特征分别送入姿态估计分支和人体解析分支中得到姿态估计与人体解析的结果。本发明提出了用于姿态估计与人体解析的多任务联合学习系统。本发明所提系统在姿态估计与人体解析任务上的表现优秀。
-
公开(公告)号:CN112990222B
公开(公告)日:2021-08-10
申请号:CN202110550131.7
申请日:2021-05-20
Applicant: 之江实验室
Abstract: 本发明公开了一种基于图像边界知识迁移的引导语义分割方法包括如下步骤:S1,引导分割模块构建,S2构建约束条件,具体分为三个部分,分别是有限样本的监督、表示一致性约束、以及边界一致性约束;S3,边界知识迁移模块构建,其中主要包括伪三元组判别数据生成、边界对抗学习;通过上述步骤建立的基于图像边界知识迁移的引导语意分割方法,能够仅通过数十张有标签样本以及大量任务无关图像数据,利用图像边界知识,通过指定语义相关图像,利用语义空间特征约束,实现特定种类样本目标的语义分割。
-
公开(公告)号:CN118397435B
公开(公告)日:2024-10-01
申请号:CN202410839719.8
申请日:2024-06-26
Applicant: 之江实验室
Abstract: 本说明书公开了基于图像识别模型的任务执行方法、装置、介质及设备,终端设备将样本图像输入到初始图像识别模型中,得到样本图像对应的表征感兴趣区域的类别激活映射图,而后通过初始图像识别模型中包含的各网络层对应的亲和矩阵对类别激活映射图进行补偿,进而确定样本图像中各像素点对应的相关性权重矩阵,从而确定出样本图像中各像素点对对应的相关性标签,根据各像素点对对应的相关性标签,调整各网络层对应的亲和矩阵,并通过调整后的图像识别模型执行任务。通过增强了调整后图像识别模型中亲和矩阵对于类别激活映射图的补偿程度,使得调整后的图像识别模型在执行任务过程中具备更强的识别精度,提高了图像识别任务的执行效率。
-
公开(公告)号:CN117152538B
公开(公告)日:2024-04-09
申请号:CN202311397429.4
申请日:2023-10-26
Applicant: 之江实验室
IPC: G06V10/764 , G06V10/774 , G06V10/30 , G06T5/70 , G06V10/82
Abstract: 本发明公开了一种基于类原型清洗去噪的图像分类方法及装置,所述方法包括以下步骤:获取图像样本并输入到图像分类模型生成伪类别标签,利用伪类别标签得到类原型;基于类原型将图像样本划分为干净图像样本与噪声图像样本,并利用干净图像样本对类原型进行更新;将噪声图像样本划分为分布内噪声图像样本和分布外噪声图像样本;利用干净图像样本、分布内噪声图像样本、以及图像样本对图像分类模型的参数进行更新,得到更新后的图像分类模型,将候选图像输入到更新后的图像分类模型,得到候选图像的类别结果。上述方案解决了噪声对含有噪声标签的图像分类任务精度低的问题。
-
公开(公告)号:CN117132841A
公开(公告)日:2023-11-28
申请号:CN202311397430.7
申请日:2023-10-26
Applicant: 之江实验室
IPC: G06V10/764 , G06V10/774 , G06V10/82 , G06F17/16
Abstract: 本发明公开了一种保守渐进的领域自适应图像分类方法和装置,包括:获取带有标签的源域图像、来自于目标域支持集的无标签的第一目标域图像、以及来自于目标域查询集的无标签的第二目标域图像;基于源域图像和第一目标域图像进行内循环更新分类器参数;基于源域图像和第二目标域图像进行外循环更新特征提取器参数;提取参数更新后的特征提取器和分类器组成图像分类模型,利用图像分类模型进行图像分类。这样在内循环中引入重放机制对分类器进行训练,在外循环中引入稀疏注意力机制对特征提取器进行训练,这样联合内外循环更新,延缓图像分类模型在不断进化的目标域中不断遗忘的情况,提升了特征提取器的提取准确性和分类器的分类准确性。
-
公开(公告)号:CN115512169B
公开(公告)日:2023-07-25
申请号:CN202211395308.1
申请日:2022-11-09
Applicant: 之江实验室
IPC: G06V10/764 , G06V10/774 , G06V10/82 , G06V20/70 , G06V10/26
Abstract: 本发明公开了基于梯度和区域亲和力优化的弱监督语义分割方法及装置,本方法提出的基于视觉Transformer的弱监督语义分割框架,可以保留精确的图像结构信息,反映像素间长距离语义关联。本发明从自注意力模块中提取梯度加权的类相关物体定位图和区域亲和度关联图,用于优化通过Transformer分类网络生成的类激活图,可以有效扩大激活区域,并使用显著性约束提高激活区域的边界质量,缓解边界被错误划分现象,为分割模型提供高质量的物体定位图;在类激活图中广泛使用的二值交叉熵(BCE)损失使CAM中每个像素可以响应于同一感受野中出现的多个类别,是造成像素标注错误的重要原因。
-
-
-
-
-
-
-
-
-