-
公开(公告)号:CN116912858A
公开(公告)日:2023-10-20
申请号:CN202310948856.0
申请日:2023-07-31
Applicant: 安徽工业大学
IPC: G06V30/228 , G06V30/18 , G06V30/19 , G06V10/44 , G06V10/80 , G06V10/764 , G06V10/82 , G06N3/0464 , G06N3/048 , G06N3/08 , G06V30/148 , G06V10/26
Abstract: 本发明涉及智能人机交互技术领域,具体涉及一种基于改进的yolov5网络与单目视觉的空中手写文本采集方法,方法包括:构建初始指尖数据集并进行预处理获取目标指尖数据集,基于高效金字塔分割注意力模块EPSA以及加权双向特征金字塔网络BiFPN对yolov5网络进行改进,获取改进的yolov5网络,将目标指尖数据集的训练集输入改进的yolov5网络获取指尖检测模型,基于单目摄像头获取空中手写文本的实时二维视频图像并输入指尖检测模型,基于坐标系虚拟滑动技术,形成空中手写文本,解决了现有技术中因3D传感器较大,价格昂贵,导致普适性不足、因对WIFI环境要求较为严格,导致局限性较大以及因指尖属于小目标,导致yolov5网络对指尖进行检测时存在检测准确率低、漏检率高的技术问题。
-
公开(公告)号:CN118821896A
公开(公告)日:2024-10-22
申请号:CN202410824707.8
申请日:2024-06-25
Applicant: 安徽工业大学
IPC: G06N3/084 , G06N3/0464 , G06F18/2431 , G06F18/2415 , G06F18/21 , G06F18/214
Abstract: 本发明提供一种用于模式识别的深度学习网络训练方法及系统,涉及深度学习领域;方法包括数据准备阶段、模型初始化阶段、前向传播阶段、损失计算阶段、反向传播阶段、模型评估阶段和结果分析阶段,损失计算阶段通过计算类内分类损失、最小化训练样本与类均值之间类内损失和最近对手类类间损失、最大化样本与最近对手类间损失,优化类内距离和类间距离;本方案解决现有深度神经网络特征提取时缺乏获取判别特征的能力,显著提升用于模式识别的深度卷积神经网络模型的判别特征提取能力。
-
公开(公告)号:CN112132186A
公开(公告)日:2020-12-25
申请号:CN202010870298.7
申请日:2020-08-26
Applicant: 安徽工业大学
Abstract: 本发明公开了一种存在部分缺失和未知类别标记的多标记分类方法,属于机器学习技术领域;本发明将部分缺失类别标记和未知类别标记的问题融合在一个框架中,利用高斯距离函数,计算样本相似度矩阵,再将相似度矩阵分解,得到完整类别标记矩阵的近似解,约束近似解的部分结果与已观测的标记结果一致,同时构建从样本特征到完整标记的分类模型,建模已知标记和新发现未知标记之间的关联性,约束相关性较强的具有相似的分类模型系数,并不断优化完整标记矩阵的结果,进而学习得到准确的分类模型。本可发明不仅可以解决已知类别标记存在部分缺失值问题,还可以发现多标记数据中的未知类别标记,挖掘出数据中有价值的隐含信息。
-
公开(公告)号:CN110009017A
公开(公告)日:2019-07-12
申请号:CN201910226726.X
申请日:2019-03-25
Applicant: 安徽工业大学
IPC: G06K9/62
Abstract: 本发明涉及机器学习领域的多标记学习技术,涉及一种基于视角类属特征学习的多视角多标记分类方法,包括:S1、获取训练数据,建立类别标记矩阵;S2、构建类别标记后各视角特征数据映射到类别标记矩阵的线性模型;S3、在线性模型基础上,建立各视角特征贡献度模型;S4、采用正则项约束视角特征贡献度模型,使每个视角特征数据在预测结果上具有一致性;S5、采用流行正则约束相关类别标记对应的模型系数的相似性;S6、标记预测,给定一个测试样本t,将测试样本t带入步骤S1-S5中得融合预测值。本申请的技术方案实现有效利用多源信息,学习每个视角中不同特征对类别标记的判别性能,更好的进行多标记学习任务。
-
公开(公告)号:CN118135285A
公开(公告)日:2024-06-04
申请号:CN202410151857.7
申请日:2024-02-02
Applicant: 安徽工业大学
IPC: G06V10/764 , G06N3/0464 , G06N3/048 , G06V10/82 , G06V10/80 , G06V10/762 , G06V10/74
Abstract: 本发明公开了一种基于类别视觉原型学习的多标签图像分类方法,涉及图像分类技术领域,解决了利用图像视觉信息有效构建多标签分类器的技术问题;本发明基于Sigmoid函数正则化处理获取类激活图M;基于类激活图M通过注意力机制将特征图X转换为类特定特征表示;基于类特定特征表示通过聚类生成的类别视觉原型构建类别视觉原型分类器;基于类特定特征表示和类别视觉原型分类器以字典学习的方式进行多标签分类,并通过总体损失训练优化模型。本发明通过生成类别视觉原型表示构建多标签分类器,避免了利用标签语义信息构建分类器而影响模型泛化性的问题,同时能够提升图像多标签分类的精度。
-
公开(公告)号:CN112308115A
公开(公告)日:2021-02-02
申请号:CN202011022191.3
申请日:2020-09-25
Applicant: 安徽工业大学
Abstract: 本发明涉及机器学习领域的多标签学习技术,涉及一种多标签图像深度学习分类方法及设备,包含以下步骤:获得标签关系图;根据标签关系图获得所有类别标签的映射和所有标签组的映射;构建深度卷积神经网络并进行图像通用特征提取;选取卷积神经网络不同层的特征图通过映射函数将其映射到标签和标签组映射的维度;对选取特征图中所有像素点计算标签和标签组在当前像素点位置的相合性评分与归一化评分;得到最终的标签相关语义特征与最终的标签组的相关语义特征;标签预测。本申请实现有效利用标签关系,学习更加丰富的图像通用特征和标签关系特征,更好的进行多标签分类任务。
-
公开(公告)号:CN111046965A
公开(公告)日:2020-04-21
申请号:CN201911306128.X
申请日:2019-12-18
Applicant: 安徽工业大学
IPC: G06K9/62
Abstract: 本发明公开了一种多标记分类中潜在类别发现和分类方法,属于机器学习技术领域;本发明将已知标记分类和潜在标记发现及分类融合在一框架中,利用非负矩阵分解技术,将特征矩阵分解为完整类别标记矩阵的近似解和系数矩阵,并约束近似解的已知部分结果与真实值一致,同时构建从样本特征到完整标记的分类模型,发现潜在的标记类型;通过潜在标记发现,挖掘出数据中有价值的隐含信息,利用已知标记和潜在标记之间的关联性,约束相关性较强的任意类别具有相似的分类模型系数,得到近似的分类预测结果,使已知标记分类和潜在标记分类相互指导,共同促进,最终提升已知标记和潜在标记的分类性能,更好的进行多标记学习任务。
-
公开(公告)号:CN118552981A
公开(公告)日:2024-08-27
申请号:CN202410722819.2
申请日:2024-06-05
Applicant: 安徽工业大学
IPC: G06V40/10 , G06V40/70 , G06V10/762 , G06V10/774 , G06V10/82 , G06V10/20 , G06V10/32 , G06V10/40 , G06V10/74 , G06F16/583 , G06N3/088 , G06N3/084 , G06N5/04
Abstract: 本发明公开了一种基于双模态数据增强的无监督跨模态行人检索方法,属于计算机视觉技术领域。本发明通过同时对可见光和红外图像进行色彩增强,拉近不同模态在特征空间的距离,提高跨模态对齐的准确度;然后采用自适应反事实推理将图拓扑结构的学习约束在较小的范围内,使模型更易于学习到更优的拓扑结构;通过上述两种操作,最终提升无监督跨模态行人检索的性能。
-
公开(公告)号:CN117725967A
公开(公告)日:2024-03-19
申请号:CN202311706284.1
申请日:2023-12-13
Applicant: 安徽工业大学
IPC: G06N3/0464 , G06N3/08 , G06F18/241
Abstract: 本申请实施例提供一种生成对抗网络模型,包括生成器和判别器;所述生成器和所述判别器均由卷积神经网络构成,所述卷积神经网络的输入卷积层的卷积核大小为2×2,其余各卷积层的卷积核大小为1×3;所述生成器用于生成长度可变的空中手写字符,其输入为各个类的混合了噪声的均值向量;所述判别器用于与所述生成器进行对抗训练,以使生成的所述长度可变的空中手写字符更加接近真实数据;所述判别器包括全局平均池化层GAP,所述平均池化层GAP用于对所述判别器进行卷积操作后生成的不同尺寸的特征图转化为等长向量。本申请实施例提供的生成对抗网络模型能够生成长度可变的联机手写字符数据。
-
公开(公告)号:CN117436488A
公开(公告)日:2024-01-23
申请号:CN202311475247.4
申请日:2023-11-08
Applicant: 安徽工业大学
IPC: G06N3/0495 , G06N3/0464 , G06N3/08
Abstract: 本申请实施例提供一种基于字典学习的神经网络模型压缩方法、装置及存储介质,该方法包括:对预先训练好的卷积神经网络模型中的每一卷积层进行卷积核参数预处理,生成每一卷积层的卷积核参数矩阵;将每一卷积核参数矩阵作为训练数据输入局部性敏感字典学习算法中,生成对应的每一卷积层的字典;基于每一卷积层的字典对同一卷积层的卷积核参数矩阵中的卷积核进行筛选,以获取每一卷积层中贡献值最大的多个目标卷积核;基于获取到的所有目标卷积核重新构建新的卷积神经网络模型,生成压缩后的神经网络模型,并对压缩后的神经网络模型进行再训练。本申请实施例能够在减小神经网络模型规模的同时保持高性能,并降低模型训练的成本。
-
-
-
-
-
-
-
-
-