-
公开(公告)号:CN110399493B
公开(公告)日:2021-11-16
申请号:CN201910691093.X
申请日:2019-07-29
Applicant: 中南大学
Abstract: 本发明公开了一种基于增量学习的作者消歧方法,包括以下步骤:获取历史引文记录,其中历史引文信息已知聚类标签,不同的聚类标签表示不同的作者个体;根据历史引文记录的数量判断各聚类簇是第一类型或第二类型的聚类簇,对于数量较多的第一类型聚类簇,则使用历史引文记录的特征向量和聚类标签训练相应的朴素贝叶斯分类器;筛选出候选聚类簇,根据所有候选聚类簇的类型,对新的引文记录分情况进行分类处理,综合使用朴素贝叶斯分类器计算所属概率进行分类,使用合著者相似度对所属概率方式分类进行补充判断,计算与第二类型聚类簇的语义相似度以解决无法使用朴素贝叶斯分类器进行概率分类的问题。本发明的作者消歧效果佳,而且计算开销低。
-
公开(公告)号:CN110362692A
公开(公告)日:2019-10-22
申请号:CN201910668329.8
申请日:2019-07-23
Applicant: 中南大学
Abstract: 本发明公开了一种基于知识图谱的学术圈构建方法,包括步骤:步骤1,获取所有学术论文信息和所有学术期刊信息,并作为初始数据源;步骤2,从初始数据源中抽取作者、论文和期刊这三种实体信息,构成实体数据集;步骤3,对实体数据集中同名的作者实体,基于相互之间的相似度进行同名消歧处理;步骤4,将同名消歧处理后得到的实体数据集存储在Neo4j图数据库中,形成实体节点;基于不同实体间的公共属性特征,为不同实体节点间建立关系边,最终得到基于知识图谱的学术圈。本发明构建的具有逻辑关系的学术圈,其数据精确度高,有利于用户迅速有效地获取到所需知识以及所需知识间的逻辑关系。
-
公开(公告)号:CN110399493A
公开(公告)日:2019-11-01
申请号:CN201910691093.X
申请日:2019-07-29
Applicant: 中南大学
Abstract: 本发明公开了一种基于增量学习的作者消歧方法,包括以下步骤:获取历史引文记录,其中历史引文信息已知聚类标签,不同的聚类标签表示不同的作者个体;根据历史引文记录的数量判断各聚类簇是第一类型或第二类型的聚类簇,对于数量较多的第一类型聚类簇,则使用历史引文记录的特征向量和聚类标签训练相应的朴素贝叶斯分类器;筛选出候选聚类簇,根据所有候选聚类簇的类型,对新的引文记录分情况进行分类处理,综合使用朴素贝叶斯分类器计算所属概率进行分类,使用合著者相似度对所属概率方式分类进行补充判断,计算与第二类型聚类簇的语义相似度以解决无法使用朴素贝叶斯分类器进行概率分类的问题。本发明的作者消歧效果佳,而且计算开销低。
-
-