-
公开(公告)号:CN110516146B
公开(公告)日:2022-08-19
申请号:CN201910635799.4
申请日:2019-07-15
Applicant: 中国科学院计算机网络信息中心
IPC: G06F16/9535 , G06N3/04 , G06N3/08
Abstract: 本发明公开了一种基于异质图卷积神经网络嵌入的作者名字消歧方法,其步骤为:1)对于一待消歧的目标作者名,收集以该目标作者名所著的出版物,然后根据所收集出版物的标题、作者列表和出版刊物信息构建出版物异质属性网络;2)根据所述出版物异质属性网络,通过基于元路径随机游走策略生成包含出版物节点邻居节点文本信息的路径;3)根据所述出版物异质属性网络以及所述路径,基于异质图卷积神经网络嵌入模型学习每一出版物的表征向量;4)根据所述出版物异质属性网络和所述出版物的表征向量,构建该目标作者名的出版物同质网络;5)对所述出版物同质网络进行划分,得到若干簇;其中同一簇中的出版物为同一人的出版物集合。
-
公开(公告)号:CN111191466B
公开(公告)日:2022-04-01
申请号:CN201911352416.9
申请日:2019-12-25
Applicant: 中国科学院计算机网络信息中心
IPC: G06F40/35 , G06F40/279 , G06F16/35
Abstract: 本发明公开了一种基于网络表征和语义表征的同名作者消歧方法。本方法为:1)提取目标论文库中各论文的语义特征和离散特征;2)基于离散特征计算各论文间的相似度,得到论文的关系相似性矩阵;如果一论文与其他论文没有共同作者或机构,则将其加入一离群论文集中;3)基于各论文的所述语义特征计算论文的语义相似度矩阵;将目标论文库中不包含语义特征的论文加入离群论文集中;4)将关系相似性矩阵和语义相似度矩阵加权求和,获得论文相似度矩阵并对其进行聚类;将不属于任何簇的论文加入离群论文集中;5)利用基于相似度阈值匹配的方法将离群论文集中的论文分配到对应的簇中。本发明实现高准确率的论文同名作者的消歧。
-
公开(公告)号:CN110516146A
公开(公告)日:2019-11-29
申请号:CN201910635799.4
申请日:2019-07-15
Applicant: 中国科学院计算机网络信息中心
IPC: G06F16/9535 , G06N3/04 , G06N3/08
Abstract: 本发明公开了一种基于异质图卷积神经网络嵌入的作者名字消歧方法,其步骤为:1)对于一待消歧的目标作者名,收集以该目标作者名所著的出版物,然后根据所收集出版物的标题、作者列表和出版刊物信息构建出版物异质属性网络;2)根据所述出版物异质属性网络,通过基于元路径随机游走策略生成包含出版物节点邻居节点文本信息的路径;3)根据所述出版物异质属性网络以及所述路径,基于异质图卷积神经网络嵌入模型学习每一出版物的表征向量;4)根据所述出版物异质属性网络和所述出版物的表征向量,构建该目标作者名的出版物同质网络;5)对所述出版物同质网络进行划分,得到若干簇;其中同一簇中的出版物为同一人的出版物集合。
-
-