-
公开(公告)号:CN112669324B
公开(公告)日:2022-09-09
申请号:CN202011643939.1
申请日:2020-12-31
Applicant: 中国科学技术大学
Abstract: 本发明公开了一种基于时序特征聚合和条件卷积的视频目标分割方法,包括:获取待分割视频的多帧图像;对多帧图像按时间顺序排列,获取记忆帧图像及查询帧图像,查询帧图像为最后一帧记忆帧图像的下一帧图像;对记忆帧图像和查询帧图像处理得到记忆帧图像特征和查询帧图像特征,对记忆帧图像的目标掩膜处理得到记忆帧掩膜特征;将记忆帧图像特征、查询帧图像特征和记忆帧掩膜特征进行特征聚合得到聚合的目标特征;根据聚合的目标特征和查询帧图像特征确定卷积核参数;通过解码网络对查询帧图像的特征和卷积核参数处理得到查询帧图像的目标分割预测结果,能高效地获取目标特征和
-
公开(公告)号:CN113378673B
公开(公告)日:2022-09-06
申请号:CN202110600569.1
申请日:2021-05-31
Applicant: 中国科学技术大学
Abstract: 本发明公开了一种基于一致性正则化的半监督脑电信号分类方法,包括:1、选取部分数据进行标注,并进行预处理;2、搭建人工神经网络,并作为特征处理器;3、对输入进行随机增强,促使样本在输入空间上出现一定的波动;4、记录每次迭代得到的输出概率,当前的结果与历史的结果进行指数滑动平均集成;5、设计损失函数,在交叉熵损失函数的基础上,设计无监督的一致性正则项优化决策边界;6、利用组合后的损失函数优化模型参数,获得最优分类模型。本发明能够在仅有一小部分数据被标注的情况下,充分利用无标注数据来优化决策边界,从而取得较为理想的脑电信号分类性能,在医疗等应用领域,对减轻标注成本有重要意义。
-
公开(公告)号:CN114925170A
公开(公告)日:2022-08-19
申请号:CN202210577416.4
申请日:2022-05-25
Abstract: 本发明公开了一种文本校对模型训练方法,基于已标注错误类型标注数据集,训练得到数据增强模型;数据增强模型训练输入数据包含错误位置的文本被替换为掩码标记第一向量以及被赋值为错误类型第二向量;基于各个错误类型特征分布和一部分未标注文本数据构建指定错误类型的预测输入数据;将预测输入数据输入给训练得到的数据增强模型,得到预测输出数据;对另一部分未标注文本数据进行随机删除操作;将预测输出数据和随机删除操作所得数据加入到标注数据集中,得到拓展数据集;利用拓展数据集,训练得到文本校对模型。本发明将错误类型作为额外的输入生成指定类型错误文本拓展数据集,减少了训练数据生成的随机性,解决了训练数据数量少的问题。
-
公开(公告)号:CN114882525A
公开(公告)日:2022-08-09
申请号:CN202210426984.4
申请日:2022-04-21
Applicant: 中国科学技术大学
IPC: G06V40/10 , G06V20/52 , G06V10/143 , G06V10/80 , G06V10/74 , G06V10/774 , G06V10/82 , G06N3/04 , G06K9/62
Abstract: 本发明提供了一种基于模态特定记忆网络的跨模态行人重识别方法,包括:获取待重识别的行人图像和重识别类型;根据重识别类型,利用基于模态特定记忆网络的跨模态行人重识别模型处理待重识别的行人图像,得到重识别结果。本发明同时还提供了用于实现基于模态特定记忆网络的跨模态行人重识别方法的电子设备、存储介质以及计算机程序产品。
-
公开(公告)号:CN111461323B
公开(公告)日:2022-07-29
申请号:CN202010174891.8
申请日:2020-03-13
IPC: G06V20/70 , G06V10/774 , G06V10/778 , G06V10/82 , G06N3/04 , G06N3/08 , G06K9/62
Abstract: 本发明提供了一种图像识别方法,包括:S1,获取训练图像集,将训练图像集中的各训练图像与该训练图像对应的类别索引进行训练,学习提取无语义视觉表达;S2,将训练图像集中各训练图像与该训练图像所对应的语义标签对齐,学习提取语义对齐的视觉表达;S3,同时对无语义视觉表达及语义对齐的视觉表达进行识别分析,得到视觉偏见消除模型;S4,将待识别图像输入视觉偏见消除模型,进行识别。本发明提供的图像识别方法通过建立视觉偏见消除模型,可以提升对已知域和未知域样本的感知效果,进而实现无偏差零样本的准确识别。
-
公开(公告)号:CN111291803B
公开(公告)日:2022-07-29
申请号:CN202010074068.X
申请日:2020-01-21
IPC: G06V10/764 , G06V10/774 , G06V10/82 , G06K9/62
Abstract: 本发明提供了一种图像分级粒度迁移方法、系统、设备和介质。所述方法包括:获取图像的视觉特征、父类别语义描述和子类别语义描述;利用双语义保留网络将所述视觉特征与所述父类别语义描述进行第一匹配,通过所述第一匹配预测图像的父类别;通过所述图像的父类别确定图像子类别的范围;获取所述视觉特征中的预设区域视觉特征,利用双语义保留网络将所述预设区域视觉特征与所述子类别语义描述在所述子类别的范围中进行第二匹配,通过所述第二匹配预测图像的子类别。实现了仅使用父类别的图像标注和分级粒度的类别描述来解决对应下属子类别的识别问题。
-
公开(公告)号:CN111435453B
公开(公告)日:2022-07-22
申请号:CN201910032246.X
申请日:2019-01-14
IPC: G06V10/764 , G06K9/62 , G06V10/774
Abstract: 本发明公开了一种细粒度图像零样本识别方法,该方法基于语义分解与迁移的零样本图像分类技术,能够充分地挖掘两个域的语义信息的同时产生无偏的语义和视觉表达,达到更好的分类效果,同时,该方法在四个公共细粒度分类数据集上都取得了目前最好的结果。
-
公开(公告)号:CN111340021B
公开(公告)日:2022-07-15
申请号:CN202010104273.6
申请日:2020-02-20
Applicant: 中国科学技术大学
IPC: G06V10/25 , G06V10/764 , G06N3/08
Abstract: 本发明公开了一种基于中心对齐和关系显著性的无监督域适应目标检测方法,训练阶段,对于源域与目标域的图像通过检测器产生对应的目标区域提案;对目标区域提案与类别中心进行关系建模,并更新类别中心与目标区域提案;利用更新得到的类别中心来拉近目标域和源域之间每一类的距离,使得目标域的不同类别之间借助源域信息拉开距离;训练完毕后,直接对目标域图像进行分类检测。该方法不需要单独地计算类别中心,而是把类别中心与目标区域提案放入图中一起更新,因此模型可被端到端训练;在类别中心对齐时,能在缩小源域和目标域分布差异的同时,扩大目标域的类间差异,从而有效地对目标域进行分类。
-
公开(公告)号:CN110263877B
公开(公告)日:2022-07-08
申请号:CN201910567794.2
申请日:2019-06-27
IPC: G06V20/62 , G06V30/166 , G06V30/19
Abstract: 本发明公开了一种场景文字检测方法,包括:利用神经网络对输入图像进行特征提取,并对提取的特征图进行上采样操作,得到不同尺寸的特征图;以最大尺寸的特征图为标准,将其余尺寸的特征图映射为与最大尺寸的特征图相同的尺寸;将映射到相同尺寸的特征图进行尺度信息的融合,得到融合后的特征图,这一融合操作能够使不同尺寸的文字在融合后的特征图中统一激活;对融合后的特征图进行文字框的回归和分类操作,得到场景文字检测结果。上述方法能够从根本上提升特征图的质量,从而提升场景文字检测的性能。
-
公开(公告)号:CN114693983A
公开(公告)日:2022-07-01
申请号:CN202210595693.8
申请日:2022-05-30
Applicant: 中国科学技术大学
IPC: G06V10/764 , G06K9/62 , G06N3/04 , G06N3/08 , G06V10/82
Abstract: 本发明提供了一种基于图像‑实例对齐网络的训练方法和跨域目标检测方法。其中,该训练方法包括:将源域图片输入目标检测主干网络,得到初始化类别原型和待训练目标检测主干网络;将源域图片和目标域图片输入待训练目标检测主干网络,得到特征图和候选框区域特征;将特征图输入自适应前景感知的注意力模块,得到域标签概率和前景感知域标签概率;将候选框区域特征和初始化类别原型输入类别感知的原型对齐模块,得到候选框区域特征矩阵和初始化类别原型矩阵,利用候选框区域特征矩阵对初始化类别原型矩阵进行更新,得到滑动平均后的类别原型矩阵;对待训练目标检测主干网络联合训练,调整待训练目标检测主干网络的网络参数。
-
-
-
-
-
-
-
-
-