-
公开(公告)号:CN113971730A
公开(公告)日:2022-01-25
申请号:CN202111247023.9
申请日:2021-10-26
Applicant: 重庆邮电大学
IPC: G06V10/30 , G06V10/764 , G06V10/774 , G06K9/62
Abstract: 本发明公开了一种基于权重的不平衡数据分类过采样方法及系统,根据待处理不平衡数据样本自带的分类标签构造若干棵完全随机树,得到完全随机森林;根据每个少数类样本在每棵完全随机树中的初步判定结果,计算每个少数类样本在完全随机森林中的权重;并判断每个少数类样本是否为噪声样本,并从少数类样本集中过滤掉所有噪声样本,根据不同过采样算法的策略从去噪声少数类样本集中筛选种子样本,对种子样本进行插值处理生成新样本;将种子样本、新样本、多数类样本集、去噪声少数类样本集进行汇总,得到采样后的平衡数据集,通过构建完全随机树计算少数类的权重,不用考虑调参问题,自适应各种情况,减少了噪声样本的产生,提高采样精度。
-
公开(公告)号:CN114003752B
公开(公告)日:2022-11-15
申请号:CN202111407452.8
申请日:2021-11-24
Applicant: 重庆邮电大学
IPC: G06F16/55 , G06V40/16 , G06V10/762
Abstract: 本发明公开了一种基于粒球人脸聚类图像质量评估的数据库精简方法及系统,其中方法包括:将人脸数据库里的每一张图像均转换为向量;将由所述向量构成的特征矩阵输入深度学习模型进行训练,得到多个特征向量;将所述多个特征向量输入粒球模型进行聚类,形成多个粒球,一个粒球中的点代表的人脸图像属于同一个人;将所述多个粒球分成若干组,每个组中包括了一个人的所有人脸图像;对每组粒球中的所有人脸图像进行质量评估,得到每张图像的分数;剔除分数小于预设分数阈值的人脸图像,得到精简后的数据库。本发明考虑了背景模糊程度和光照程度等因素进行打分从而筛选出最适合计算机识别的图像,精简后的数据库容易被处理和识别。
-
公开(公告)号:CN113987188A
公开(公告)日:2022-01-28
申请号:CN202111326798.5
申请日:2021-11-10
Applicant: 重庆邮电大学
Abstract: 本发明公开了一种短文本分类方法、装置及电子设备,涉及数据处理技术领域,其技术方案要点是:确定短文本的知识信息与关键词;将短文本、知识信息与关键词嵌入向量空间进行拼接,获得短文本、知识信息与关键词的向量矩阵;采用双向记忆网络层对短文本向量矩阵进行处理获得短文本的语义信息;将短文本的语义信息与知识信息的向量矩阵或关键字的向量矩阵进行注意力计算获得知识信息或关键词的向量;利用卷积神经网络对向量与向量矩阵进行特征提取获得短文本分类结果。本发明解决了现有技术对于短文本分类方法中在面对短文本上下文语义缺失不能准确的进行文本分类问题,提升了文本分类的准确性。
-
公开(公告)号:CN113887742A
公开(公告)日:2022-01-04
申请号:CN202111248092.1
申请日:2021-10-26
Applicant: 重庆邮电大学
IPC: G06N20/10
Abstract: 本发明公开了一种基于支持向量机的数据分类方法及系统,包括以下步骤:获取待分类数据,采用改进投票率的基于完全随机森林的噪声滤波学习方法进行数据清洗去除待分类数据中的噪声,得到无噪声待分类数据集;对无噪声待分类数据集进行线性映射,得到无噪声线性数据集,通过将惩罚系数设置为其取值范围内的最大值来修正SVM模型;将无噪声线性数据集作为支持向量机的训练集输入到修正后的SVM模型中进行训练和分类,得到数据的分类结果,通过优化投票机制改进了CRF‑NFL的投票机制,并将CRF‑NFL和SVM结合,使得分类器对噪声样本能有更好的识别,使CRF‑NFL更有效地过滤类噪声,从而提高分类器的验证精度。
-
公开(公告)号:CN113987188B
公开(公告)日:2022-07-08
申请号:CN202111326798.5
申请日:2021-11-10
Applicant: 重庆邮电大学
IPC: G06F16/35 , G06F40/284 , G06F40/30 , G06N3/04
Abstract: 本发明公开了一种短文本分类方法、装置及电子设备,涉及数据处理技术领域,其技术方案要点是:确定短文本的知识信息与关键词;将短文本、知识信息与关键词嵌入向量空间进行拼接,获得短文本、知识信息与关键词的向量矩阵;采用双向记忆网络层对短文本向量矩阵进行处理获得短文本的语义信息;将短文本的语义信息与知识信息的向量矩阵或关键字的向量矩阵进行注意力计算获得知识信息或关键词的向量;利用卷积神经网络对向量与向量矩阵进行特征提取获得短文本分类结果。本发明解决了现有技术对于短文本分类方法中在面对短文本上下文语义缺失不能准确的进行文本分类问题,提升了文本分类的准确性。
-
公开(公告)号:CN114003752A
公开(公告)日:2022-02-01
申请号:CN202111407452.8
申请日:2021-11-24
Applicant: 重庆邮电大学
IPC: G06F16/55 , G06V40/16 , G06V10/762
Abstract: 本发明公开了一种基于粒球人脸聚类图像质量评估的数据库精简方法及系统,其中方法包括:将人脸数据库里的每一张图像均转换为向量;将由所述向量构成的特征矩阵输入深度学习模型进行训练,得到多个特征向量;将所述多个特征向量输入粒球模型进行聚类,形成多个粒球,一个粒球中的点代表的人脸图像属于同一个人;将所述多个粒球分成若干组,每个组中包括了一个人的所有人脸图像;对每组粒球中的所有人脸图像进行质量评估,得到每张图像的分数;剔除分数小于预设分数阈值的人脸图像,得到精简后的数据库。本发明考虑了背景模糊程度和光照程度等因素进行打分从而筛选出最适合计算机识别的图像,精简后的数据库容易被处理和识别。
-
-
-
-
-