-
公开(公告)号:CN113627172A
公开(公告)日:2021-11-09
申请号:CN202110845130.5
申请日:2021-07-26
Applicant: 重庆邮电大学
IPC: G06F40/284 , G06F40/295 , G06F40/216 , G06K9/62
Abstract: 本发明涉及信息提取领域,尤其涉及一种基于多粒度特征融合和不确定去噪的实体识别方法及系统,包括使用Transformer对语料文本进行字粒度的多级局部特征提取,得到局部字粒度特征;使用jieba工具进行分词,并使用Glove预训练的词向量将得到的分词进行向量嵌入,得到全局词粒度特征;对分词后得到的词集进行编码,得到文本的词结构编码向量;将Transformer得到的局部字粒度特征、Glove得到的全局词粒度特征与词结构编码特征进行融合;将融合后得到的文本特征送入BiGRU+CRF的序列标注模型中,最终得到识别的实体结果;本发明可对病理领域中文文本进行精准、全面的实体抽取,抽取效果较好。
-
公开(公告)号:CN109918544B
公开(公告)日:2021-03-12
申请号:CN201910191833.3
申请日:2019-03-14
Applicant: 重庆邮电大学
IPC: G06F16/903 , G06F16/9038 , G06F16/901 , G06Q50/26 , G06Q50/00
Abstract: 本发明属于职务犯罪领域,涉及社会关系网络分析,具体为一种基于粗糙集的职务犯罪社会关系网络智能分析方法及系统,所述方法包括通过对已结案中犯罪人员的社会关系网络进行分类,并基于粗糙集对社会关系网络进行智能分析,发现其中对案件起关键作用的线索,并去除其中的无关线索;基于已结案件数据,采用粗糙集方法,从多种数据中筛选出对案件分析起作用的数据,去除对案件分析不起作用的冗余数据,并对各种数据源进行重要性排序,从而为实际办案提供辅助。
-
公开(公告)号:CN112288571A
公开(公告)日:2021-01-29
申请号:CN202011329953.4
申请日:2020-11-24
Applicant: 重庆邮电大学
Abstract: 本发明属于计算机科学与技术领域,具体涉及一种基于快速构建邻域覆盖的个人信用风险评估方法,该方法包括:获取贷款人的个人信息数据,对该信息数据进行预处理;采用K‑means聚类算法对预处理后的数据进行聚类,构建邻域覆盖序列;计算邻域覆盖序列中的邻域中心局部密度和相对距离;根据邻域中心的局部密度和相对距离对邻域进行排序;对排序后的邻域进行选择,并对选择的邻域进行风险评估预测,得到预测结果;根据风险评估结果确定是否对贷款人进行贷款;本发明通过邻域中心的局部密度与相对距离的乘积对邻域进行选择,能够更好的评估邻域的分类能力,使得在更少的邻域下得到更高的精度。
-
公开(公告)号:CN105760888A
公开(公告)日:2016-07-13
申请号:CN201610100024.3
申请日:2016-02-23
Applicant: 重庆邮电大学
IPC: G06K9/62
CPC classification number: G06K9/6227 , G06K9/6221
Abstract: 本发明请求保护一种基于属性聚类的邻域粗糙集集成学习方法,涉及数据挖掘技术。首先,通过属性聚类将决策系统中的条件属性分成多个聚类簇,使得属性聚类簇内的属性关联性较大,而不同属性聚类簇之间的关联性较小;其次,利用各个聚类簇的差异性来训练集成不同的基分类器,在训练集成基分类器的过程中,加入了邻域粗糙集的指导,根据基分类器对邻域粗糙集中边界域的样本不同的识别能力来分配基分类器的权重,从而得到最终的集成分类器;最后,利用得到的集成分类器对测试集分类。本发明结合了邻域粗糙集和集成学习理论,充分利用了决策表中条件属性的相关性和差异性,并使不同基分类器之间取长补短,能够从不同角度有效挖掘决策系统中的知识。
-
公开(公告)号:CN113627185B
公开(公告)日:2024-11-22
申请号:CN202110864136.7
申请日:2021-07-29
Applicant: 重庆邮电大学
IPC: G06F40/295 , G06F16/35 , G06N20/20 , G16H50/70
Abstract: 本发明属于自然语言处理领域,具体涉及一种用于肝癌病理文本命名的实体识别方法,该方法包括:实时获取肝癌病理文本信息,对该文本信息进行预处理;将预处理后的文本信息输入到训练好的肝癌病理文本命名实体模型,得到肝癌病理文本信息识别结果;根据识别结果对肝癌病理文本信息进行分类标记;本发明可对肝癌病理文本的十类关键实体进行精准的识别抽取,实体识别效果较好。
-
公开(公告)号:CN118070278A
公开(公告)日:2024-05-24
申请号:CN202311611901.X
申请日:2023-11-29
Applicant: 重庆邮电大学
IPC: G06F21/56 , G06N20/00 , G06F18/214 , G06F21/60 , G06N3/0464
Abstract: 本发明涉及一种联邦学习后门攻击防御方法及系统,属于信息安全领域。该方法首先终端在执行本地训练前进行数据预处理操作,将数据从时域转换到频域,并设计低通滤波器过滤数据中由后门样本带来的高频信号;其次在服务器端检测恶意上传更新,计算预全局模型与本地模型间的余弦相似度,设置合适的阈值筛选恶意上传的本地模型更新;最后对剩余的非恶意上传更新执行全局聚合操作得到更新的全局模型,并结合差分隐私技术对得到的全局模型进行扰动。本发明充分考虑了后门攻击在不同位置进行攻击的情形,可以在减轻联邦学习后门攻击的同时不影响模型在良性数据上的表现性能,解决了联邦学习的后门攻击防御问题。
-
公开(公告)号:CN115938567A
公开(公告)日:2023-04-07
申请号:CN202211608821.4
申请日:2022-12-14
Applicant: 重庆邮电大学
IPC: G16H50/20 , G16H50/30 , G06F18/2321
Abstract: 本发明属于计算机数据挖掘领域计算医疗方向,特别涉及一种基于标签不平衡的医疗数据的疾病预测方法,所述方法包括:获取医疗数据集,进行预处理;聚类标签信息粒,选择标签信息粒的最靠近中心的标签组合为代表标签集;对特征集做离散化处理得到离散特征集;使用代表标签集和离散特征集进行特征选择;已选特征集和标签集放入多标签k近邻分类器中进行训练,本发明创新的采用粒计算的思想,将多标签数据的标签部分进行聚类,选择最靠近中心标签的作为代表标签集,使得聚类更为准确,可以选择更准确的代表标签,创新性的引入动态特征部分,使特征选择方法在少量的特征选择数量下达到更高的准确率。
-
公开(公告)号:CN112784171B
公开(公告)日:2022-11-04
申请号:CN202110083203.1
申请日:2021-01-21
Applicant: 重庆邮电大学
IPC: G06F16/9536
Abstract: 本发明属于计算机科学与技术邻域,具体涉及一种基于上下文典型性的电影推荐方法,该方法包括:获取用户数据,根据用户数据以及每个用户对不同电影类型的上下文典型性构建上下文典型性矩阵;在上下文典型性矩阵中寻找近邻,根据近邻的上下文属性值计算近邻用户的评分;根据用户数据的评分信息,采用知识粒度计算出上下文属性对每个电影类型的重要度;根据重要度和单上下文的计算出多上下文的预测评分;根据多上下文的预测评分对电影进行推荐;相比传统的协同过滤推荐系统,本发明用典型性协同过滤替代传统协同过滤,有效的缓解了数据的稀疏性。
-
公开(公告)号:CN112288571B
公开(公告)日:2022-06-10
申请号:CN202011329953.4
申请日:2020-11-24
Applicant: 重庆邮电大学
Abstract: 本发明属于计算机科学与技术领域,具体涉及一种基于快速构建邻域覆盖的个人信用风险评估方法,该方法包括:获取贷款人的个人信息数据,对该信息数据进行预处理;采用K‑means聚类算法对预处理后的数据进行聚类,构建邻域覆盖序列;计算邻域覆盖序列中的邻域中心局部密度和相对距离;根据邻域中心的局部密度和相对距离对邻域进行排序;对排序后的邻域进行选择,并对选择的邻域进行风险评估预测,得到预测结果;根据风险评估结果确定是否对贷款人进行贷款;本发明通过邻域中心的局部密度与相对距离的乘积对邻域进行选择,能够更好的评估邻域的分类能力,使得在更少的邻域下得到更高的精度。
-
公开(公告)号:CN112507299B
公开(公告)日:2022-05-03
申请号:CN202011400514.8
申请日:2020-12-04
Applicant: 重庆邮电大学
Abstract: 本发明属于持续身份认证领域,具体涉及一种持续身份认证系统中的自适应击键行为认证方法及装置;所述认证方法包括提取出键对数据中每个按键的持续时间的统计特征,并将这些统计特征进行聚类处理,使用类标签替换对应按键数据的键值,采用数据集对单分类器进行训练调整,按照单分类器的分类结果计算出三支决策所需的阈值α和β;将待测的键对数据输入到单分类器中,将单分类器的输出结果与三支决策的阈值α和β进行比较判断,输出最终的认证结果;本发明可以在较小的所需键对期望值下获得较高的认证准确率,实现持续认证系统中安全性与用户友好性的平衡。
-
-
-
-
-
-
-
-
-