机构命名实体归一化方法和系统

    公开(公告)号:CN112215006B

    公开(公告)日:2022-08-09

    申请号:CN202011141016.6

    申请日:2020-10-22

    Abstract: 本发明提供了一种机构命名实体归一化方法和系统,该方法包括:对学术机构信息数据进行筛选,去除错误数据后,得到预处理数据;对所述预处理数据进行去噪处理,得到机构命名实体归一化数据;通过构建的目标文本分类模型对机构命名实体归一化数据进行自动判别,输出判别结果,以得到机构命名实体归一化后的标准名称;根据所述标准名称,统计对应机构的论文数据。从而可以对每一个学术机构的论文数据进行统计,使得对学术机构的学术能力进行更加科学、直观地判别。

    基于LEAM模型的机构命名实体归一化方法和系统

    公开(公告)号:CN112215007A

    公开(公告)日:2021-01-12

    申请号:CN202011141040.X

    申请日:2020-10-22

    Abstract: 本发明提供了一种基于LEAM模型的机构命名实体归一化方法和系统,包括:步骤S1:通过预设统计规则对所有的学术机构信息数据进行筛选,去除不符合预设条件的数据;步骤S2:在筛选过的数据中,根据正则表达式去除数据中存在的噪音;步骤S3:将去噪的数据按照类别和预设比例分为训练集、验证集和测试集;步骤S4:将训练集和验证集输入LEAM模型,训练出用于机构命名实体归一化的模型;步骤S5:将测试集输入训练好的模型中,测试模型效果并进行微调。通过本发明可以对每一个学术机构的论文发表数进行统计,从而可以更科学,更直观的对某个学术机构的学术能力进行判别。

    知识图谱架构的构建与应用方法、系统及介质

    公开(公告)号:CN111444348A

    公开(公告)日:2020-07-24

    申请号:CN202010124150.9

    申请日:2020-02-27

    Abstract: 本发明提供了一种知识图谱架构的构建与应用方法、系统及介质,包括:步骤1:通过对学术领域的实体进行定义与学术知识图谱的本体构建来完成知识建模;步骤2:进行实体对齐,即对于异构数据源知识库中的各个实体,找出属于现实世界中的同一实体;步骤3:利用基于规则的知识图谱推理方法来丰富知识图谱;步骤4:评估知识图谱架构--AceKG嵌入知识的几种最先进的方法;步骤5:评估知识图谱架构—AceKG网络表示学习的几种最先进的方法。本发明不仅提供纯净的学术信息,还为研究人员提供了一个大规模的基准数据集,为评估知识嵌入和网络表示学习方法提供了基础,为了丰富提出的知识图谱架构。

Patent Agency Ranking