一种草图识别方法以及该方法在商品检索中的应用

    公开(公告)号:CN109325529B

    公开(公告)日:2021-07-30

    申请号:CN201811036370.5

    申请日:2018-09-06

    Applicant: 安徽大学

    Inventor: 赵鹏 冯晨成 韩莉

    Abstract: 本发明公开了一种草图识别方法,该方法包括以下步骤:S1.获取待处理图片;S2.对收集到的图片进行具有语义信息的部件分割,得到草图的部件图;S3.利用深度学习网络模型通过对部件图的识别,得出部件的标签;S4.将部件的语义信息同部件所属对象的语义信息相关联;S5.输出经过语义树得到的部件所属对象的标签。以及草图识别方法在商品检索中的应用,其特征在于,包括以下步骤:1)获取图片信息,2)检索系统利用所述草图识别方法,根据图片获得用户想要寻找的物品的标签,3)根据识别的标签,为用户推荐相应的商品。本发明提高了对完整草图识别的正确率,并且可以节约用户挑选商品的时间,增强用户体验。

    一种草图识别方法以及该方法在商品检索中的应用

    公开(公告)号:CN109325529A

    公开(公告)日:2019-02-12

    申请号:CN201811036370.5

    申请日:2018-09-06

    Applicant: 安徽大学

    Inventor: 赵鹏 冯晨成 韩莉

    Abstract: 本发明公开了一种草图识别方法,该方法包括以下步骤:S1.获取待处理图片;S2.对收集到的图片进行具有语义信息的部件分割,得到草图的部件图;S3.利用深度学习网络模型通过对部件图的识别,得出部件的标签;S4.将部件的语义信息同部件所属对象的语义信息相关联;S5.输出经过语义树得到的部件所属对象的标签。以及草图识别方法在商品检索中的应用,其特征在于,包括以下步骤:1)获取图片信息,2)检索系统利用所述草图识别方法,根据图片获得用户想要寻找的物品的标签,3)根据识别的标签,为用户推荐相应的商品。本发明提高了对完整草图识别的正确率,并且可以节约用户挑选商品的时间,增强用户体验。

    多策略标签消歧的偏多标签分类方法、设备及存储介质

    公开(公告)号:CN117992835A

    公开(公告)日:2024-05-07

    申请号:CN202410399836.7

    申请日:2024-04-03

    Applicant: 安徽大学

    Abstract: 本发明是一种多策略标签消歧的偏多标签分类方法、设备及存储介质,所述方法步骤为:构建偏多标签数据集,包含样本特征数据集和候选标签数据集;使用嵌入网络生成的样本嵌入特征,用于计算标签原型;通过多策略标签消歧操作,排除候选标签集中的噪声标签并计算每个样本中的高置信度标签;使用消歧后的标签置信度重新计算并更新标签原型,并将更新后的标签原型与样本嵌入特征共同用于训练嵌入网络;通过度量嵌入网络生成的测试样本特征与各个标签原型之间的相似度来进行分类。本发明可减少噪声信息的影响,增强模型在未知数据上的泛化能力,从而提升偏多标签分类性能。

    基于样本生成的小样本图像分类方法、设备及存储介质

    公开(公告)号:CN116168257B

    公开(公告)日:2023-07-04

    申请号:CN202310436361.X

    申请日:2023-04-23

    Applicant: 安徽大学

    Abstract: 本发明是一种基于样本生成的小样本图像分类方法、设备及存储介质,包括利用预先构建好的小样本图像分类模型对图像数据进行分类,所述小样本图像分类模型构建步骤包括对数据集划分出基类数据集和新类数据集;排除基类数据中每个类别中干扰样本的影响,找到每个类中最具有代表性的样本数据训练特征生成器;利用训练好的特征生成器生成更多的样本,更新新类中各类别原型;计算查询集中查询样本各局部特征在各类别判定中的权重,并获得各类别判定中的查询样本的加权特征表示;通过度量类原型和加权后的查询样本来进行分类。本发明可提高对目标对象区域的关注程度,减少对其他无关区域的关注,从而提升小样本图像分类性能。

    一种基于特征修正的细粒度图像分类方法及系统

    公开(公告)号:CN116310559A

    公开(公告)日:2023-06-23

    申请号:CN202310277109.9

    申请日:2023-03-21

    Applicant: 安徽大学

    Abstract: 本发明涉及一种基于特征修正的细粒度图像分类方法及系统。图像分类方法包括如下步骤:S1:对训练集中的每个图像进行预处理得到预处理图像;S2:构建基于特征修正的网络模型,提取预处理图像中的特征FL和特征FL‑1;S3:移除类间的公共特征以增大类间方差,得到第一分类损失;S4:采用中心损失缩小类内方差,得到第二分类损失;S5:通过加权求和得到整体损失,利用反向传播的方法对网络模型进行训练;S6:采用训练后的网络模型预测每个待处理图像的类别。本发明通过提取待处理图像的公共原型、移除公共相似特征的方式来增大类间方差,利用中心损失缩小类内方差,以指导网络得到更好的分类结果,提高细粒度图像分类的精确度。

    零样本图像识别方法及其识别装置、介质与计算机终端

    公开(公告)号:CN114821196A

    公开(公告)日:2022-07-29

    申请号:CN202210638733.2

    申请日:2022-06-08

    Applicant: 安徽大学

    Inventor: 赵鹏 刘金辉 韩莉

    Abstract: 本发明涉及公开了一种基于原型域对齐与跨模态重建的零样本图像识别方法,其包括以下主要步骤:提取可见类样本的视觉特征;通过特征分布编码器获得可见类图像的视觉分布信息;通过特征生成器获得生成的视觉特征;通过设计分布正则化损失、域一致性损失、视觉重建损失、对抗损失和语义重建损失,训练优化所述特征生成器的模型的参数,获得训练好的特征生成器;将未见类语义特征输入训练好的特征生成器获得生成的未见类视觉特征;利用生成的未见类视觉特征训练未见类分类器;利用训练好的未见类分类器对未见类图像进行预测。本发明通过原型域一致性对齐和跨模态重建,使生成的视觉特征与真实的视觉特征更加接近,并且包含更多的类别判别性特征。

    基于音视频双模态的语音识别方法及系统

    公开(公告)号:CN114974215B

    公开(公告)日:2025-04-11

    申请号:CN202210515512.6

    申请日:2022-05-11

    Applicant: 安徽大学

    Inventor: 赵鹏 唐宝威 韩莉

    Abstract: 本发明涉及语音技术领域,公开了一种基于音视频双模态的语音识别方法及系统,方法包括获取待处理的音频数据和视频数据;对音频数据进行特征提取,得到音频特征;采用3D和2D卷积网络对视频数据进行特征提取,得到视频特征;采用基于Transformer的双向信息交互的编码器,对音频特征和视频特征进行编码;采用基于Transformer的音视频解码器,预测出当前时间步的字符的状态码,获得音视频对应的预测状态序列;将状态序列一一映射为文本,得到文本信息。该方法不仅有效且鲁棒,且可满足用户嘈杂环境下的语音识别需求,提高语音识别结果准确度,增强用户体验。

    一种基于深度学习的轻量型SAR图像目标检测方法

    公开(公告)号:CN112115911A

    公开(公告)日:2020-12-22

    申请号:CN202011038411.1

    申请日:2020-09-28

    Applicant: 安徽大学

    Inventor: 宋尚香 赵鹏 余豪

    Abstract: 本发明涉及雷达技术技术领域,具体涉及一种基于深度学习的轻量型SAR图像目标检测方法,包括以下步骤:数据集的准备和处理,将SSDD+数据集中的标签中四角点坐标进行minAreaRect函数得到目标最小外接矩形的斜框坐标值,将坐标值替换原本标签中的四角点坐标值,此时获得的数据集记为SSDD1数据集;本发明利用残差网络提取原始SAR图像的高维特征,通过Ghostnet进行多次卷积提取高维特征,同时进行反卷积进行上采样到四倍下采样后的特征图后通过三个分支进行预测,实现了无锚点框的端到端的基于中心点预测SAR图像的斜框目标检测方法,本发明实现简单,检测精度高,适用场景广泛的特点。

    多策略标签消歧的偏多标签分类方法、设备及存储介质

    公开(公告)号:CN117992835B

    公开(公告)日:2024-06-21

    申请号:CN202410399836.7

    申请日:2024-04-03

    Applicant: 安徽大学

    Abstract: 本发明是一种多策略标签消歧的偏多标签分类方法、设备及存储介质,所述方法步骤为:构建偏多标签数据集,包含样本特征数据集和候选标签数据集;使用嵌入网络生成的样本嵌入特征,用于计算标签原型;通过多策略标签消歧操作,排除候选标签集中的噪声标签并计算每个样本中的高置信度标签;使用消歧后的标签置信度重新计算并更新标签原型,并将更新后的标签原型与样本嵌入特征共同用于训练嵌入网络;通过度量嵌入网络生成的测试样本特征与各个标签原型之间的相似度来进行分类。本发明可减少噪声信息的影响,增强模型在未知数据上的泛化能力,从而提升偏多标签分类性能。

    一种零样本图像识别方法、系统及可存储介质

    公开(公告)号:CN116433969A

    公开(公告)日:2023-07-14

    申请号:CN202310303332.6

    申请日:2023-03-24

    Applicant: 安徽大学

    Abstract: 本发明提供了一种零样本图像识别方法、系统及可存储介质,包括:获取数据集;设计注意力机制提取可见类图像的鉴别性视觉特征;对属于同一个可见类别的所有图像做均值操作以获得该可见类的视觉原型;通过迁移可见类和不可见类之间的语义属性关系来获得不可见类的视觉原型;利用类视觉原型之间的关系构建视觉原型图,并初始化节点表示;设计编码器进行节点信息的传播和聚合以获得新的潜在空间;利用可见类图像以及标签训练模型;利用训练好的模型对不可见类图像进行预测。本发明通过注意力机制以及类别之间的语义关系获得所有类的视觉原型表示,再经过视觉原型图传播获得判别潜在空间,在潜在空间中进行分类,提高了分类准确率。

Patent Agency Ranking