-
公开(公告)号:CN119886139A
公开(公告)日:2025-04-25
申请号:CN202411645805.1
申请日:2024-11-18
Applicant: 中国科学院计算机网络信息中心
IPC: G06F40/295 , G06F40/30 , G06F16/35 , G06F16/36 , G06N3/045 , G06N3/082 , G06N3/0442 , G06N3/047
Abstract: 本发明公开了一种CO2催化领域的多层次、广类别命名实体识别方法,其步骤包括:1)对关于CO2电催化还原的论文进行标注,得到一训练样本;2)生成训练样本的语义表示;3)将训练样本的语义表示输入实体识别模型,预测得到样本中每一实体的类型;根据预测结果和标注结果优化实体识别模型;4)根据设定的命名实体分类层级结构对各类型的实体进行细粒度标注,并将标注结果保存到数据字典中;5)对于一待处理论文,将该待处理论文的语义表示输入优化后的所述实体识别模型,预测得到该待处理论文中每一实体的类型;然后根据实体的类型在所述数据字典中查找匹配的细粒度类型,得到该待处理论文中每一实体的细粒度类型识别结果。
-
公开(公告)号:CN112069290B
公开(公告)日:2022-07-12
申请号:CN202010730690.1
申请日:2020-07-27
Applicant: 中国科学院计算机网络信息中心
IPC: G06F16/33 , G06F16/335 , G06F40/30 , G06N3/04 , G06N3/08
Abstract: 本发明公开了一种基于图局部结构和文本语义相似性的学术论文推荐方法。本方法为:1)基于论文库中论文的关键词、机构、作者特征构建包含论文和论文关系的异质网络;2)对于论文pi,基于该异质网络计算与论文pi有关联的论文相似度,形成一推荐结果候选集;3)生成论文库中每一论文的关系表征向量和语义表征向量,并加权求和得到对应论文的最终表征向量;将论文pi加入到该论文库中并生成论文pi的最终表征向量;4)计算论文库中每一论文的最终表征向量与论文pi的最终表征向量的相似性,并根据所得相似性选取多个论文作为论文pi的待推荐候选论文;5)将推荐结果候选集与待推荐候选论文进行融合,选取相似性最高的若干论文作为论文pi的推荐论文。
-
公开(公告)号:CN112069817A
公开(公告)日:2020-12-11
申请号:CN202010692579.8
申请日:2020-07-17
Applicant: 中国科学院计算机网络信息中心
IPC: G06F40/295 , G06F16/36
Abstract: 本发明公开了一种学者知识抽取与融合方法及装置。本方法为:1)从各设定数据源获取学者相关的文本,并将文本存入学者文本库;2)从学者文本库中抽取实体和实体关系,则生成对应的实体关系对;3)将每一所述实体关系对i与学术领域知识库进行匹配,如果所述实体关系对i与所述学术领域知识库中一实体关系对a完全匹配,则在实体关系对a中标记新数据来源;如果没有匹配的实体关系对,则根据实体关系对i在所述学术领域知识库中创建新一实体关系对b并标记数据来源;如果与实体关系对c部分匹配,则在实体关系对c上增加对应的新实体或关系,并标记数据来源;4)对步骤3)处理后的所述学术领域知识库进行校对,更新学术领域知识库。
-
公开(公告)号:CN106997692B
公开(公告)日:2020-06-12
申请号:CN201710383979.9
申请日:2017-05-26
Applicant: 广州数字方舟信息技术股份有限公司 , 中国科学院计算机网络信息中心
Abstract: 本发明提供一种混合型航标报警智能检测方法,其步骤包括:1)根据历史定时数据和历史报警数据发现相似站点,得到相似站点划分及相似站点数据;2)根据上述相似站点划分及相似站点数据、历史报警数据及该报警时刻向前一段时间的历史定时数据进行报警模型训练,生成二次报警的模型;3)将实时报警数据及该报警时刻向前一段时间的历史定时数据输入所述二次报警的模型,进行报警结果判断;4)根据上述报警结果及人工反馈的报警结果,对步骤2)中所述报警模型进行修正。该方法能够在充分利用领域知识的前提下,结合数据挖掘方法和人工反馈,实现对航标异常进行报警。且该方法能够有效提高报警判断的准确率。
-
公开(公告)号:CN106250534A
公开(公告)日:2016-12-21
申请号:CN201610640243.0
申请日:2016-08-05
Applicant: 中国科学院计算机网络信息中心
IPC: G06F17/30
CPC classification number: G06F16/26
Abstract: 本发明涉及一种基于主题流的时空延迟相关性可视化方法。该方法以主题流这种基于独立空间的可视化方法为基础,通过对主题流增加相关性大小、不同时序数据延迟的时间长度、以及空间距离的支持,以达到对具有空间关系的多时序数据的延迟相关性的可视化及分析;在此基础上,通过基于距离的分组,以及增加对二维空间的支持,给出了能够进一步增加空间分析能力的可视化方法。本发明能够通过多主题流的方式实现对具有空间关系的多时序数据的可视化。
-
公开(公告)号:CN103678593A
公开(公告)日:2014-03-26
申请号:CN201310682924.X
申请日:2013-12-12
Applicant: 中国科学院计算机网络信息中心
IPC: G06F17/30
CPC classification number: G06F17/30247 , G06K9/685
Abstract: 本发明公开了一种空间场景草图描述SSDL方法以及基于SSDL的空间场景检索方法,1)通过交互方式提供需要建立空间场景草图的空间场景,所述空间场景至少包括空间对象输入、对象关系输入以及手势输入中的一种;2)根据交互输入识别输入的场景,并将识别结果记录到用于空间检索的SSDL中;3)根据所述SSDL在一预置地理空间数据库中进行相似空间场景的检索,4)根据相似度计算检索出SSDL中的空间对象/关系中与所述地理空间数据库相似的场景;5)输出相似空间场景检索结果。本发明首次提出SSDL空间场景草图,并通过SSDL对空间场景检索内容进行描述,通过草图用户界面来进行空间场景检索的输入,提高了交互的自然性。
-
公开(公告)号:CN110659768B
公开(公告)日:2023-01-17
申请号:CN201910749170.2
申请日:2019-08-14
Applicant: 中国科学院计算机网络信息中心
Abstract: 本发明提出一种数据出版物学术影响力评价预测方法,包括如下步骤:提取数据论文个体的不同时间段的引用次数和引用格式文件下载次数,计算得到不同时间段的引用转化率数据;选择回归模型,根据引用转化率数据,利用曲线拟合方法进行拟合;根据拟合的结果,构建数据论文个体的影响力评价预测模型,利用该影响力评价预测模型,计算数据论文个体的某时间段的引用次数,实现影响力的评价或预测。本方法能够有效评价并预测各个数据论文的引用影响力情况。
-
公开(公告)号:CN112069306B
公开(公告)日:2022-09-09
申请号:CN202010710086.2
申请日:2020-07-22
Applicant: 中国科学院计算机网络信息中心
IPC: G06F16/335 , G06F16/332 , G06N3/04 , G06N3/08
Abstract: 本发明公开了一种基于作者著作树和图神经网络的论文合作者推荐方法,其步骤包括:1)对于数据库中的每一个作者,收集该作者的论文并提取关键词信息,构建该作者的著作树;2)对每个著作树,基于图神经网络模型构建对应作者著作树的信息传播模型,将著作树上的论文信息和关键词信息传播到作者节点中,编码出对应作者初始的表征向量;3)从该数据库中抽取出所有合作过的作者对集合,训练信息传播模型的参数,优化各初始表征向量,得到各作者最终的表征向量;4)对于一需推荐合作者的论文A,遍历与论文A的作者未曾合作过的作者集合N;然后比较作者A与集合N中每一作者最终的表征向量余弦相似度,根据计算结果为论文A的作者推荐合作者。
-
公开(公告)号:CN114049966A
公开(公告)日:2022-02-15
申请号:CN202210029619.X
申请日:2022-01-12
Applicant: 中国科学院计算机网络信息中心
Abstract: 本发明涉及一种基于链接预测的食源性疾病暴发识别方法和系统。该方法包括:对食源性疾病暴发事件数据进行数据处理;对数据处理之后的病例数据进行采样,得到正负样本对集合;对正负样本对集合中的各个正负样本对进行特征提取;将特征提取后的正负样本对输入基于神经网络构建的链接预测模型,以学习病例与病例之间的关联关系;根据链接预测模型的输出构建病例关系网络,网络中的节点表示病例实体,边表示病例之间的关联关系,边权值反映病例间关联强度;根据病例关系网络,采用社区发现算法得到食源性疾病暴发事件。本发明将传统聚类问题转化为病例间关联关系预测与图网络中社区发现的问题,从而取得了比传统聚类算法更好的暴发事件识别效果。
-
公开(公告)号:CN113111178B
公开(公告)日:2021-12-10
申请号:CN202110240824.6
申请日:2021-03-04
Applicant: 中国科学院计算机网络信息中心
Abstract: 本发明公开了一种无监督的基于表示学习的同名作者消歧方法及装置,包括:对科学文献数据进行预处理;利用Word2Vec预训练模型和SCIBERT预训练模型分别生成基于Word2Vec和基于SCIBERT的文本语义表示向量;通过对消歧数据的处理生成局部异质网络,指定元路径metapath并利用metapath2vec方法获取基于局部图结构的论文关系表示向量;针对上述三种表征向量分别生成相似度矩阵并进行加权求和;利用无监督聚类方法进行聚类;对聚类离散点进行簇指派,得到最终消歧结果。本发明利用论文的表征信息,结合多重混合的表征学习和聚类离散点指派方法,增强消歧算法的泛化能力与鲁棒性,提高了消歧准确度与消歧效率。
-
-
-
-
-
-
-
-
-