-
公开(公告)号:CN109858544B
公开(公告)日:2021-01-29
申请号:CN201910077726.8
申请日:2019-01-28
Applicant: 重庆邮电大学
IPC: G06K9/62
Abstract: 本发明属于钢材质量测试领域,具体涉及一种基于区间阴影集和密度峰值聚类的钢材质量检测方法;所述方法包括获取原始钢材数据集,采用欧式距离公式计算得到其距离矩阵;通过密度峰值聚类中的计算公式,获取局部密度矩阵和相对距离矩阵;输出密度峰值聚类中数据集的决策图,并选取m个聚类中心,将非聚类中心进行归类得到m个类簇;计算出m个类簇中各个对象的隶属度值;通过最小化模糊熵差异,确定出m个类簇的最优阈值序列;基于最优阈值序列,采用分类规则分别对m个类簇中的非中心对象按照其隶属度值采用区间阴影集进行三支分类,从而确定出每个对象的质量检测结果,即获得原始钢材数据集的质量检测结果。本发明能够有效且快速的检测出钢材质量。
-
公开(公告)号:CN109547460B
公开(公告)日:2020-12-04
申请号:CN201811517670.5
申请日:2018-12-12
Applicant: 重庆邮电大学
Abstract: 本发明属于信息安全技术领域,具体涉及一种面向身份联盟的多粒度联合身份认证方法;所述方法包括研究各种身份信息的可信程度,并将其作为各种身份信息多粒度联合的权值;以代价最小化为约束条件,面向用户需求的多粒度联合身份认证以及面向用户身份信息可用性的身份认证;当用户提出访问需求时,身份联盟根据应用系统对身份认证安全性的需求,进行身份认证方案的评估和筛选,提高了身份认证的安全性和可靠性。
-
公开(公告)号:CN111444712A
公开(公告)日:2020-07-24
申请号:CN202010217695.4
申请日:2020-03-25
Applicant: 重庆邮电大学
IPC: G06F40/284 , G06F40/242 , G06F16/35 , G06Q50/18
Abstract: 本申请实施例公开了一种关键词提取方法、终端、计算机可读存储介质,其中方法包括:输入专利文本;根据第一预设模型对所述专利文本进行关键词抽取处理,得到关键词候选集;根据第二预设模型对所述专利文本进行专利要素抽取处理,得到所述专利文本的专利要素集;将所述关键词候选集与所述专利要素集进行权重值计算,根据权重值计算结果确定出所述专利文本的关键词集合。通过上述方法可以提高专利文本领域中关键词提取结果的准确性。
-
公开(公告)号:CN106598743B
公开(公告)日:2020-06-16
申请号:CN201611259383.X
申请日:2016-12-30
Applicant: 重庆邮电大学
IPC: G06F9/50
Abstract: 本发明请求保护一种基于MPI并行求信息系统属性约简的方法,首先,读取信息系统的数据,将数值进行预处理,数据离散化;其次,将信息系统水平划分为p个样本数据子集,通过通信分配给n个节点,并行计算数据子集的等价类,将各个节点的结果整合得到整个信息系统的m个等价类划分子信息系统;然后,将m个子信息系统分配给n个节点,并行计算属性核,直到处理完所有子信息系统,再将各个节点的结果合并,得出整个信息系统的属性核;最后,并行求出属性约简,将各个节点的属性约简结果进行整合,得到整个信息系统的属性约简。本发明结合了粗糙集属性约简方法和MPI并行计算,从而使得用分辨矩阵求属性约简的运算可以并行求得,提高算法的效率。
-
公开(公告)号:CN106528874B
公开(公告)日:2019-07-19
申请号:CN201611120338.6
申请日:2016-12-08
Applicant: 重庆邮电大学
IPC: G06F16/2458
Abstract: 本发明提供一种基于Spark大数据平台的CLR多标签分类方法,涉及数据挖掘技术。本发明通过特征与标签的关系将每个数据集划分成一个区;将训练集中的数据集随机抽取一部分当作测试集,剩余的数据集当训练集建立基分类器,再将测试集用来测试分类器并修改其基分类器的参数,从而在训练的多个基分类器中选取最好的一个基分类器作为本数据集的基分类器。利用最终的多个基分类器对预测集进行预测。本发明结合了CLR多标签学习算法和Spark基于内存的高效计算理论,充分利用了CLR算法中标签转化后的无相关性,降低了不同的基分类器之间的干扰性,再充分利用Spark的计算框架的运行速度,能有效的对数据进行挖掘。
-
公开(公告)号:CN107273912A
公开(公告)日:2017-10-20
申请号:CN201710326684.8
申请日:2017-05-10
Applicant: 重庆邮电大学
CPC classification number: G06K9/6256 , G06K9/6215 , G06N99/005
Abstract: 本发明请求保护一种基于三支决策的主动学习算法,通过使用三支决策的思想来解决目前无标记样本的问题。涉及到粗糙集,数据挖掘等领域。首先通过margin策略来确定无标记数据的不确定性。然后通过不确定性将无标记数据划分为三个不同的域:正域、负域、边界域。对于每个域中的数据采用相应的解决方案来进行处理。目的就是为了选择信息量高,代表性强的数据进行标记。将这些标记好的数据添加到训练集,创建新的分类器。通过反复迭代的训练学习,直到达到迭代的预设次数或达到期望的评估标准。本发明可以较好的提高分类器的各项性能。
-
公开(公告)号:CN106598743A
公开(公告)日:2017-04-26
申请号:CN201611259383.X
申请日:2016-12-30
Applicant: 重庆邮电大学
IPC: G06F9/50
Abstract: 本发明请求保护一种基于MPI并行求信息系统属性约简的方法,首先,读取信息系统的数据,将数值进行预处理,数据离散化;其次,将信息系统水平划分为p个样本数据子集,通过通信分配给n个节点,并行计算数据子集的等价类,将各个节点的结果整合得到整个信息系统的m个等价类划分子信息系统;然后,将m个子信息系统分配给n个节点,并行计算属性核,直到处理完所有子信息系统,再将各个节点的结果合并,得出整个信息系统的属性核;最后,并行求出属性约简,将各个节点的属性约简结果进行整合,得到整个信息系统的属性约简。本发明结合了粗糙集属性约简方法和MPI并行计算,从而使得用分辨矩阵求属性约简的运算可以并行求得,提高算法的效率。
-
公开(公告)号:CN118607523A
公开(公告)日:2024-09-06
申请号:CN202410332692.3
申请日:2024-03-22
Applicant: 重庆邮电大学
IPC: G06F40/295 , G06N3/044 , G06N3/08 , G06F16/33
Abstract: 本发明属于命名实体识别领域,具体涉及一种用于中文医疗嵌套命名的实体识别方法,包括:获取公开数据集,对公开数据集进行预处理;采用循环神经网络RNN对预处理后的数据进行处理,得到翻译数据;获取原始文本句子集合,构建类别标签信息;将句子和类别标签信息分别输入到编码器中,得到标签信息向量表示和句子向量表示;将翻译数据输入到Bert模型中,得到增强的词汇表;分别对句子向量表示和标签信息向量表示进行预处理;对预处理后的句子向量表示进行词汇增强;将增强后的句子向量表示与标签信息向量表示进行拼接融合,将融合后的向量表示输入到实体识别模型中,得到实体的识别结果;本发明引入不同类别的知识,解决了嵌套实体识别问题。
-
公开(公告)号:CN118467747A
公开(公告)日:2024-08-09
申请号:CN202410224274.2
申请日:2024-02-29
Applicant: 重庆邮电大学
IPC: G06F16/36 , G06N3/045 , G06N3/0464 , G06N3/0499
Abstract: 本发明属于本发明属于知识图谱领域,具体涉及一种基于联合抽取和链接预测的知识图谱构建及补全方法,包括:基于潜在关系检测和条件实体映射的联合实体关系抽取方法用来构建知识图谱;融合图结构信息和多重特征的知识图谱链接预测方法来对抽取阶段生成的知识图谱进行自动补全。本发明的方法解决了现有知识图谱构建方法在三元组抽取过程中存在的关系冗余、噪声导致的不能准确识别出重叠三元组的问题,以及在知识图谱补全阶段全局特征捕获不充分、未利用图结构信息的问题。
-
公开(公告)号:CN118114764A
公开(公告)日:2024-05-31
申请号:CN202410348446.7
申请日:2024-03-26
Applicant: 重庆邮电大学
IPC: G06N5/025 , G06N5/02 , G06N3/0455 , G06N3/096 , G06F40/295
Abstract: 本发明属于自然语言处理技术领域,具体涉及一种多粒度的实体关系抽取方法;包括:将预处理好的训练文本输入到句子编码器中进行处理,得到每层的句子隐藏状态向量和两个词的实体隐藏状态向量;构建多种粒度下的实体隐藏状态向量矩阵并根据该矩阵计算得到两个词的实体最终表示;对每层的句子隐藏状态向量进行加权层池化处理,拼接两个词的实体最终表示和池化处理得到的句子序列编码结果,得到句子综合表示;重构标签并对重构后的标签进行编码;根据句子综合表示和重构标签编码进行对比学习;计算三元损失并根据三元损失调整模型参数,得到训练好的模型;本发明可解决缺乏同时考虑文本全局与局部信息、获得的文本编码结果缺乏迁移学习效果的问题。
-
-
-
-
-
-
-
-
-