-
公开(公告)号:CN119808921A
公开(公告)日:2025-04-11
申请号:CN202411936764.1
申请日:2024-12-26
Applicant: 中国科学院计算技术研究所
IPC: G06N5/022 , G06F18/20 , G06F18/213 , G06F18/25 , G06N3/042 , G06N3/045 , G06N3/0464 , G06N3/0895
Abstract: 本发明提出一种基于本体增强和特征融合的知识图谱实体对齐方法和装置,包括:获取待实体对齐的多个知识图谱;通过本体增强编码器将知识知识图谱引入本体信息,得到增强图谱;结构编码器提取增强图谱的结构信息,得到知识图谱的结构特征;通过关系编码器提取知识图谱的关系信息,得到关系特征;通过属性编码器器提取知识图谱的属性信息,生成属性特征;通过实体名称编码器,将知识图谱的实体名称信息进行提取,生成实体名称特征;对上述特征向量和实体名称特征分别进行动态特征加权后,进行特征融合形成统一实体向量表示,通过自适应对比学习的方法对形成统一的实体向量进行实体对齐,得到多个知识图谱的实体对齐知识图谱,作为实体对齐结果。
-
公开(公告)号:CN102147792B
公开(公告)日:2012-11-21
申请号:CN201010110386.3
申请日:2010-02-09
Applicant: 中国科学院计算技术研究所
Abstract: 本发明提供一种客户化知识智能系统,其特征在于自然语言理解准确率高、系统反应速度快、容错性好、设计人性化等,主要包括:NLP模块,用于对客户的短信咨询进行文本识别,从中得出咨询信息,所述咨询信息包括客户咨询的业务名称、主题和摘要;咨询分发模块,用于把咨询分配给各个话务员;知识库缓存模块,用于存放知识库内容,所述知识库内容包括业务名称、主题和摘要,以及与上述三者相对应的答案;以及话务员模块,用于接受话务员登陆,并为话务员提供显示接口和控制接口;同时还用于调用知识库缓存模块得出对应于咨询信息的答案以供话务员使用。本发明能够极大地提高咨询业务处理效率,缩短咨询回复时间,减少客服资源浪费。
-
公开(公告)号:CN102376014A
公开(公告)日:2012-03-14
申请号:CN201010250006.6
申请日:2010-08-10
Applicant: 中国科学院计算技术研究所
IPC: G06Q10/00
Abstract: 本发明有关于一种支持客户和业务多样性的应答管理方法及其系统,其中该方法包括:步骤1,维护应答时效层,选择应答的有效时段;步骤2,维护客户群层,选择应答所属的客户群类别;步骤3,维护电子渠道层,选择应答的电子渠道;步骤4,维护业务指令,选择应答与业务指令的相关性;步骤5,维护环境标签,选择应答的业务服务状态;步骤6,维护地域标签,选择应答的有效区域;步骤7,对参数模板进行维护;步骤8,维护应答内容层,选择应答的形态,并利用所述参数模板对应答内容进行维护。采用本发明方法实现了多层次、多标签、多形态的应答管理,方便应答管理员快速地维护、查询应答,节省了维护应答的时间,降低了维护应答的成本。
-
公开(公告)号:CN104714938B
公开(公告)日:2017-12-29
申请号:CN201310683961.2
申请日:2013-12-12
Applicant: 联想(北京)有限公司 , 中国科学院计算技术研究所
Abstract: 本发明公开了一种信息处理方法,应用于一电子设备中,所述电子设备能够获得一垃圾信息样本数据库,当所述电子设备接收到一信息时,所述方法包括:通过第一预定规则判断所述信息是否为垃圾信息;当通过所述第一预定规则判断所述信息不是垃圾信息时,将所述信息与所述垃圾信息样本数据库中的垃圾信息样本进行匹配,判断匹配结果是否满足第二预定规则;当匹配不成功时,通过第三预定规则判断所述信息是否为垃圾信息。通过该方法,消除了现有技术中垃圾信息过滤精度有限的技术问题,实现了提高垃圾信息过滤准确性的技术效果。
-
公开(公告)号:CN104714939B
公开(公告)日:2017-09-29
申请号:CN201310685298.X
申请日:2013-12-13
Applicant: 联想(北京)有限公司 , 中国科学院计算技术研究所
IPC: G06F17/27
Abstract: 本发明公开了一种信息处理方法,用以提高确定出的无关语的准确性。该方法包括:在至少一个初始信息中,确定M个第一标识信息和N个第二标识信息;分别根据每个第一标识信息按预定规则进行搜索,获得相应的M’搜索信息组,且所述M’搜索信息组中包含的至少一个搜索信息构成第一信息集合;分别根据每个第二标识信息在所述待处理信息中进行扩展,获得相应的N’个扩展信息组,所述N个扩展信息组中包含的至少一个扩展信息构成第二信息集合;将所述第一信息集合、所述第二信息集合与所述初始信息集合进行合并,获得包含至少一个更新信息的更新信息集合。本发明还公开了相应的电子设备。
-
公开(公告)号:CN104714939A
公开(公告)日:2015-06-17
申请号:CN201310685298.X
申请日:2013-12-13
Applicant: 联想(北京)有限公司 , 中国科学院计算技术研究所
IPC: G06F17/27
Abstract: 本发明公开了一种信息处理方法,用以提高确定出的无关语的准确性。该方法包括:在至少一个初始信息中,确定M个第一标识信息和N个第二标识信息;分别根据每个第一标识信息按预定规则进行搜索,获得相应的M’搜索信息组,且所述M’搜索信息组中包含的至少一个搜索信息构成第一信息集合;分别根据每个第二标识信息在所述待处理信息中进行扩展,获得相应的N’个扩展信息组,所述N个扩展信息组中包含的至少一个扩展信息构成第二信息集合;将所述第一信息集合、所述第二信息集合与所述初始信息集合进行合并,获得包含至少一个更新信息的更新信息集合。本发明还公开了相应的电子设备。
-
公开(公告)号:CN102147792A
公开(公告)日:2011-08-10
申请号:CN201010110386.3
申请日:2010-02-09
Applicant: 中国科学院计算技术研究所
Abstract: 本发明提供一种客户化知识智能系统,其特征在于自然语言理解准确率高、系统反应速度快、容错性好、设计人性化等,主要包括:NLP模块,用于对客户的短信咨询进行文本识别,从中得出咨询信息,所述咨询信息包括客户咨询的业务名称、主题和摘要;咨询分发模块,用于把咨询分配给各个话务员;知识库缓存模块,用于存放知识库内容,所述知识库内容包括业务名称、主题和摘要,以及与上述三者相对应的答案;以及话务员模块,用于接受话务员登陆,并为话务员提供显示接口和控制接口;同时还用于调用知识库缓存模块得出对应于咨询信息的答案以供话务员使用。本发明能够极大地提高咨询业务处理效率,缩短咨询回复时间,减少客服资源浪费。
-
公开(公告)号:CN119962515A
公开(公告)日:2025-05-09
申请号:CN202510034936.4
申请日:2025-01-09
Applicant: 中国科学院计算技术研究所
IPC: G06F40/205 , G06F40/279 , G06N3/096 , G06N3/0895 , G06N3/045 , G06N3/0475 , G06N5/04 , G06N5/025
Abstract: 本发明提出一种基于大模型知识蒸馏的文档级事件抽取方法,包括:构建训练文档的事件本体信息;基于事件本体信息和大语言模型,构建训练文档的包含上下文信息的事件抽取问题;获取与事件抽取问题匹配的强相关片段;以教师模型基于该强相关片段生成软标签,以软标签构建软标签数据集;构建问答模型,以软标签数据集训练问答模型;以完成训练的问答模型,对目标文档进行事件抽取操作。本发明还提出一种基于大模型知识蒸馏的文档级事件抽取装置。本发明提供一种文档级事件抽取的方法,利用预训练大模型的知识,将其在长文本和复杂事件处理方面的丰富信息迁移到较小的问答模型中,在较少标注数据的情况下,提高事件识别和论元提取的准确率。
-
公开(公告)号:CN119739795A
公开(公告)日:2025-04-01
申请号:CN202411799665.3
申请日:2024-12-09
Applicant: 中国科学院计算技术研究所
IPC: G06F16/28 , G06F16/22 , G06F40/284 , G06F40/30 , G06N3/045 , G06N3/0442 , G06F18/214 , G06F18/2431 , G06F18/2415
Abstract: 本发明提出一种基于BERT和TCSMN的表格分类方法和装置,包括:获取以序列表示的待分类表格;构建包括特征提取层、注意力层和归一化层的表格分类模型,其中该特征提取层结构为串联的BERT网络模型、TCSMN网络模型和MLP网络模型;利用该特征提取层,提取该待分类表格中单元格间的时序依赖,根据该时序依赖,利用该MLP网络模型,将所述待分类表格转换为该中间表格;利用该注意力层,分别获取该中间表格中每行和每列数据的语义结构信息;根据该语义结构信息和预设的多个表格类别,对该待分类表格进行分类,得到该待分类表格的表格类别。
-
公开(公告)号:CN119691090A
公开(公告)日:2025-03-25
申请号:CN202411849332.7
申请日:2024-12-16
Applicant: 中国科学院计算技术研究所
Abstract: 本发明提出一种实体关系抽取方法、装置、设备、介质及程序产品,该方法包括如下步骤:依据给定实体对或者给定关系通过大语言模型生成非结构化文本;将所述非结构化文本添加至实体关系联合抽取模型的初始训练集,得到目标训练集;利用所述目标训练集对所述实体关系联合抽取模型进行训练;对获取的目标文本进行编码处理,得到所述目标文本的特征向量;基于训练好的所述实体关系联合抽取模型,结合所述特征向量对所述目标文本进行实体关系抽取,得到所述目标文本的三元组。该方法提高了实体关系联合抽取模型的可泛化能力和鲁棒性,提高了文本的实体关系抽取的有效性。
-
-
-
-
-
-
-
-
-