一种基于权重的不平衡数据分类过采样方法及系统

    公开(公告)号:CN113971730A

    公开(公告)日:2022-01-25

    申请号:CN202111247023.9

    申请日:2021-10-26

    Abstract: 本发明公开了一种基于权重的不平衡数据分类过采样方法及系统,根据待处理不平衡数据样本自带的分类标签构造若干棵完全随机树,得到完全随机森林;根据每个少数类样本在每棵完全随机树中的初步判定结果,计算每个少数类样本在完全随机森林中的权重;并判断每个少数类样本是否为噪声样本,并从少数类样本集中过滤掉所有噪声样本,根据不同过采样算法的策略从去噪声少数类样本集中筛选种子样本,对种子样本进行插值处理生成新样本;将种子样本、新样本、多数类样本集、去噪声少数类样本集进行汇总,得到采样后的平衡数据集,通过构建完全随机树计算少数类的权重,不用考虑调参问题,自适应各种情况,减少了噪声样本的产生,提高采样精度。

    一种基于消息聚合的车载自组网高效可靠路由方法

    公开(公告)号:CN107343301B

    公开(公告)日:2019-12-06

    申请号:CN201710366639.5

    申请日:2017-05-23

    Abstract: 本发明提出一种基于消息聚合的车载自组网高效可靠路由方法。它由在时序上有交错的“控制消息生成、传输与处理”和“数据包传输与处理”两部分内容组成,包含“Beacon消息自适应聚合”、“数据包与Beacon消息自适应聚合”和“节点偏离最短路径时重新寻路”三种新机制;其中,第一种新机制工作在“控制消息生成、传输与处理”部分,第二种新机制同时工作在“控制消息生成、传输与处理”和“数据包传输与处理”两部分,第三种新机制工作在“数据包传输与处理”部分。本发明提出的新方法通过自适应聚合多个Beacon消息、自适应聚合数据包和Beacon消息以及在携带数据包的节点偏离预设的最短路径时重新寻找最短路径,能够减少控制开销,提高数据包传送成功率,降低数据包端到端平均时延。

    一种基于多层次对齐的跨域EEG信号情绪识别方法

    公开(公告)号:CN119760539A

    公开(公告)日:2025-04-04

    申请号:CN202411830951.1

    申请日:2024-12-12

    Abstract: 本发明属于脑机接口情绪识别领域,具体涉及一种基于多层次对齐的跨域EEG信号情绪识别方法,包括:获取脑电信号,将脑电信号输入到训练好的情绪识别模型中,得到情绪分类结果;情绪识别模型的训练过程包括:获取脑电信号并进行预处理,将预处理后的脑电数据划分为源域数据和目标域数据;对源域和目标域数据进行特征提取,得到浅层特征和深层特征;根据浅层特征的无条件MMD损失和深层特征的条件MMD损失更新模型参数,直到得到训练好的情绪识别模型;本发明通过浅层特征的无条件MMD损失有效减少了域间的通用特征差异,通过深层特征的条件MMD损失进一步增强了不同类别的特征一致性,实现了源域与目标域之间的精细特征对齐。

    一种短文本分类方法、装置及电子设备

    公开(公告)号:CN113987188A

    公开(公告)日:2022-01-28

    申请号:CN202111326798.5

    申请日:2021-11-10

    Abstract: 本发明公开了一种短文本分类方法、装置及电子设备,涉及数据处理技术领域,其技术方案要点是:确定短文本的知识信息与关键词;将短文本、知识信息与关键词嵌入向量空间进行拼接,获得短文本、知识信息与关键词的向量矩阵;采用双向记忆网络层对短文本向量矩阵进行处理获得短文本的语义信息;将短文本的语义信息与知识信息的向量矩阵或关键字的向量矩阵进行注意力计算获得知识信息或关键词的向量;利用卷积神经网络对向量与向量矩阵进行特征提取获得短文本分类结果。本发明解决了现有技术对于短文本分类方法中在面对短文本上下文语义缺失不能准确的进行文本分类问题,提升了文本分类的准确性。

    一种基于支持向量机的数据分类方法及系统

    公开(公告)号:CN113887742A

    公开(公告)日:2022-01-04

    申请号:CN202111248092.1

    申请日:2021-10-26

    Abstract: 本发明公开了一种基于支持向量机的数据分类方法及系统,包括以下步骤:获取待分类数据,采用改进投票率的基于完全随机森林的噪声滤波学习方法进行数据清洗去除待分类数据中的噪声,得到无噪声待分类数据集;对无噪声待分类数据集进行线性映射,得到无噪声线性数据集,通过将惩罚系数设置为其取值范围内的最大值来修正SVM模型;将无噪声线性数据集作为支持向量机的训练集输入到修正后的SVM模型中进行训练和分类,得到数据的分类结果,通过优化投票机制改进了CRF‑NFL的投票机制,并将CRF‑NFL和SVM结合,使得分类器对噪声样本能有更好的识别,使CRF‑NFL更有效地过滤类噪声,从而提高分类器的验证精度。

    一种基于粒球计算的人物社交网络主题识别方法及系统

    公开(公告)号:CN114387118B

    公开(公告)日:2024-04-30

    申请号:CN202210038530.X

    申请日:2022-01-13

    Inventor: 夏书银 唐祚 张勇

    Abstract: 本发明公开了一种基于粒球计算的人物社交网络主题识别方法及系统,其中方法包括:获取若干人物的社交网络主题标签和所述人物在社交网络的简介信息;对每个所述简介信息进行词嵌入处理,得到若干高维向量表示,每个高维向量表示即一个样本;将所述若干样本作为一个粒球,对所述粒球进行分裂;将分裂得到的所有粒球输入GBSVM分类模型进行训练;将待测人物在社交网络的简介信息作为一个粒球输入训练后的GBSVM分类模型进行预测,得到所述待测人物的社交网络主题标签。本发明将所述粒球分裂成若干个符合质量要求的粒球的过程中,平滑掉了通过自动标注方式获得人物简介信息样本集时产生的噪声数据,提高社交网络主题识别结果的准确性。

    基于粒球人脸聚类图像质量评估的数据库精简方法及系统

    公开(公告)号:CN114003752B

    公开(公告)日:2022-11-15

    申请号:CN202111407452.8

    申请日:2021-11-24

    Abstract: 本发明公开了一种基于粒球人脸聚类图像质量评估的数据库精简方法及系统,其中方法包括:将人脸数据库里的每一张图像均转换为向量;将由所述向量构成的特征矩阵输入深度学习模型进行训练,得到多个特征向量;将所述多个特征向量输入粒球模型进行聚类,形成多个粒球,一个粒球中的点代表的人脸图像属于同一个人;将所述多个粒球分成若干组,每个组中包括了一个人的所有人脸图像;对每组粒球中的所有人脸图像进行质量评估,得到每张图像的分数;剔除分数小于预设分数阈值的人脸图像,得到精简后的数据库。本发明考虑了背景模糊程度和光照程度等因素进行打分从而筛选出最适合计算机识别的图像,精简后的数据库容易被处理和识别。

    一种基于粒球计算的人物社交网络主题识别方法及系统

    公开(公告)号:CN114387118A

    公开(公告)日:2022-04-22

    申请号:CN202210038530.X

    申请日:2022-01-13

    Inventor: 夏书银 唐祚 张勇

    Abstract: 本发明公开了一种基于粒球计算的人物社交网络主题识别方法及系统,其中方法包括:获取若干人物的社交网络主题标签和所述人物在社交网络的简介信息;对每个所述简介信息进行词嵌入处理,得到若干高维向量表示,每个高维向量表示即一个样本;将所述若干样本作为一个粒球,对所述粒球进行分裂;将分裂得到的所有粒球输入GBSVM分类模型进行训练;将待测人物在社交网络的简介信息作为一个粒球输入训练后的GBSVM分类模型进行预测,得到所述待测人物的社交网络主题标签。本发明将所述粒球分裂成若干个符合质量要求的粒球的过程中,平滑掉了通过自动标注方式获得人物简介信息样本集时产生的噪声数据,提高社交网络主题识别结果的准确性。

Patent Agency Ranking