-
公开(公告)号:CN110232113A
公开(公告)日:2019-09-13
申请号:CN201910292426.1
申请日:2019-04-12
Applicant: 中国科学院计算技术研究所
IPC: G06F16/332 , G06F16/33 , G06F17/27
Abstract: 本发明提出一种提高知识库问答准确度的方法及系统,包括:获取待回答的用户问句,提取该用户问句中的主题实体,以该主题实体检索知识库,将得到的每一个候选答案的路径信息作为候选路径,并预处理该用户问句,得到该用户问句的向量表示;利用该向量表示对该候选路径上的每一步关系利用注意力机制进行打分,得到该候选路径上的每一步关系的关系置信度,并将该候选路径上所有的关系置信度求和,得到关系路径的路径置信度;将所有候选路径根据其置路径置信度进行排序,输出路径置信度最高的候选路径作为该用户问句的回答结果。本发明增强了中间结点在整个关系推断中的作用,提高了关系推断的准确率。
-
公开(公告)号:CN109271524A
公开(公告)日:2019-01-25
申请号:CN201810870053.7
申请日:2018-08-02
Applicant: 中国科学院计算技术研究所
IPC: G06F16/36 , G06F16/332
Abstract: 本发明提供一种知识库问答系统中的实体链接方法,包括:从问句中获取主题词集合;根据获取的主题词集合在知识库中进行搜索,得到初步候选实体集合;对于所述初步候选实体集合中的每个实体,从该实体、所述问句以及所述知识库提取相应的特征;以及,根据提取到的所述初步候选实体集合中的每个实体的特征,得到该实体的评分,并且根据评分得到候选实体集合;本发明提高了实体链接的准确性和效率。
-
公开(公告)号:CN119294469A
公开(公告)日:2025-01-10
申请号:CN202411219818.2
申请日:2024-09-02
Applicant: 中国科学院计算技术研究所 , 苏州空天信息研究院
IPC: G06N3/091 , G06N3/045 , G06F18/214
Abstract: 本发明提供一种面向知识获取的主动学习方法,用于对知识获取模型进行多次迭代训练,每次迭代包括:获取有多个有标签的样本的第一训练集和有多个未标注标签的样本的候选数据集,每个样本为一段文本数据,标签为在知识获取任务中为样本设置的知识类别标签;获取预设的查询函数,该函数用于计算样本对训练模型的价值量化值,样本的价值量化值是预设的不确定性指标和多个预设指标的加权和,多个预设指标包括动量指标、方差指标和损失值指标中任意两个或三个;根据利用查询函数计算的多个未标注标签的样本各自的价值量化值,选择有价值的样本,对其标注标签后添加到第一训练集,得到第二训练集;利用第二训练集训练模型根据文本数据进行知识类别预测。
-
公开(公告)号:CN119204013A
公开(公告)日:2024-12-27
申请号:CN202411218721.X
申请日:2024-09-02
Applicant: 中国科学院计算技术研究所 , 苏州空天信息研究院
IPC: G06F40/295 , G06F40/284 , G06F16/35 , G06F18/241 , G06N3/042 , G06N3/0455 , G06N3/048 , G06N3/096 , G06N3/0442
Abstract: 本发明提供了一种基于原型网络门控机制的类增量知识获取方法,包括获取待预测的文本;将文本输入经知识获取领域的类增量学习方法训练得到的编码模块,得到各词元的特征向量,并各词元的特征向量构建每个知识单元的单元表示;利用预设的原型网络门控机制确定各知识单元所属的类别,包括:获取每个知识单元的单元表示与各类别的原型表示之间的相似度,根据相似度筛选部分匹配的专家网络对知识单元进行预测,得到筛选出的专家网络对知识单元是否属于该专家网络对应类别的预测值;对于重叠的知识单元,仅保留其中具有最高预测值的知识单元的预测值;如果一个知识单元在所有类别的预测值都小于预设阈值,则该知识单元不属于任何专家网络所对应的类别。
-
公开(公告)号:CN110502742B
公开(公告)日:2021-11-05
申请号:CN201910625736.0
申请日:2019-07-11
Applicant: 中国科学院计算技术研究所
IPC: G06F40/295 , G06N3/04 , G06N3/08
Abstract: 本发明涉及一种复杂实体抽取方法,用于迭层膨胀卷积神经网络,该神经网络包括字级别迭层膨胀卷积神经网络层和词级别迭层膨胀卷积神经网络层,该方法包括:语料生成步骤,用于构建实体语料集,以采集语料,并对该语料进行自定义格式标注,形成训练集、测试集和/或验证集;字级别向量生成步骤,用于对该语料进行预训练,生成字向量,并将该字向量输入该字级别迭层膨胀卷积神经网络层,得到字级别向量;自定义特征提取步骤,用于从自由文本中提取所述自定义格式标注的特征;实体抽取步骤,将所述字级别向量进行拼接后,与所述词级别特征输入该词级别迭层膨胀卷积神经网络层,对所述自由文本进行复杂实体的抽取。该方法提高了实体抽取的精度和效率。
-
公开(公告)号:CN109992629A
公开(公告)日:2019-07-09
申请号:CN201910149696.7
申请日:2019-02-28
Applicant: 中国科学院计算技术研究所
IPC: G06F16/28
Abstract: 本发明涉及一种融合实体类型约束的神经网络关系抽取方法及系统,包括对实体类型施加注意力机制,该机制对实体的多种类型分配了不同权重,从而凸显了影响最大的类型标签;在损失函数中添加实体类型约束函数,该约束函数在更新过程中使实体词向量学习到实体类型信息,从而实现实体类型对关系的约束。该技术增强了模型对通用方法无法区别关系的识别能力。
-
公开(公告)号:CN106909622A
公开(公告)日:2017-06-30
申请号:CN201710041593.X
申请日:2017-01-20
Applicant: 中国科学院计算技术研究所
IPC: G06F17/30
CPC classification number: G06F16/288 , G06F16/2237
Abstract: 本发明提供了一种知识图谱的向量表示方法。该方法包括:将知识图谱中的实体对、关系和实体对之间的多步关系路径表示为初始低维向量;利用间隔可变的损失函数训练实体对、关系和实体对之间的多步关系路径的低维向量表示的模型。利用本发明学习到的模型进行关系推理能够提高不同的知识图谱中的推理的精确度。
-
公开(公告)号:CN106060577A
公开(公告)日:2016-10-26
申请号:CN201610516071.6
申请日:2016-07-01
Applicant: 中国科学院计算技术研究所
IPC: H04N21/232 , H04N21/4722 , H04N21/475 , H04N21/4788 , H04N21/482
CPC classification number: H04N21/4828 , H04N21/232 , H04N21/4722 , H04N21/475 , H04N21/4788
Abstract: 本发明提供一种基于二维码的影视剧互动的方法,包括:根据观众扫描的二维码内容,确定影视剧标识和节目播放者标识;根据所述影视剧标识,提供与所述影视剧相关的互动信息;根据所述节目播放者标识,提供所述节目播放者的服务入口。根据本发明的方法或设备,能够以二维码为索引标识,在影视剧作品、节目播放者和微博间进行索引,从而一次性向请求者提供与影视剧作品、节目播放者相关的多个微博标识、以及相应的影视海报、人员信息和图片。
-
公开(公告)号:CN106060576A
公开(公告)日:2016-10-26
申请号:CN201610516030.7
申请日:2016-07-01
Applicant: 中国科学院计算技术研究所
IPC: H04N21/232 , H04N21/4722 , H04N21/475 , H04N21/4788 , H04N21/482
CPC classification number: H04N21/4828 , H04N21/232 , H04N21/4722 , H04N21/475 , H04N21/4788
Abstract: 本发明提供一种基于二维码的综艺节目互动的方法及设备。根据本发明的方法,包括:根据观众扫描的二维码内容,确定综艺节目标识和节目播放者标识;2)根据所述综艺节目标识,提供与所述综艺节目相关的互动信息;3)根据所述节目播放者标识,提供所述节目播放者的服务入口。根据所述的方法,其中,所述综艺节目标识还用于标识综艺节目的期数。根据本发明的方法或设备,能够以二维码为索引标识,在综艺节目作品、节目提供者和微博间进行索引,从而一次性向请求者提供与综艺节目作品、节目提供者相关的多个微博标识、以及相应的影视海报、人员信息和图片。
-
-
-
-
-
-
-
-