-
公开(公告)号:CN109271524B
公开(公告)日:2021-10-15
申请号:CN201810870053.7
申请日:2018-08-02
Applicant: 中国科学院计算技术研究所
IPC: G06F16/36 , G06F16/332
Abstract: 本发明提供一种知识库问答系统中的实体链接方法,包括:从问句中获取主题词集合;根据获取的主题词集合在知识库中进行搜索,得到初步候选实体集合;对于所述初步候选实体集合中的每个实体,从该实体、所述问句以及所述知识库提取相应的特征;以及,根据提取到的所述初步候选实体集合中的每个实体的特征,得到该实体的评分,并且根据评分得到候选实体集合;本发明提高了实体链接的准确性和效率。
-
公开(公告)号:CN109992629B
公开(公告)日:2021-08-06
申请号:CN201910149696.7
申请日:2019-02-28
Applicant: 中国科学院计算技术研究所
IPC: G06F16/28
Abstract: 本发明涉及一种融合实体类型约束的神经网络关系抽取方法及系统,包括对实体类型施加注意力机制,该机制对实体的多种类型分配了不同权重,从而凸显了影响最大的类型标签;在损失函数中添加实体类型约束函数,该约束函数在更新过程中使实体词向量学习到实体类型信息,从而实现实体类型对关系的约束。该技术增强了模型对通用方法无法区别关系的识别能力。
-
公开(公告)号:CN109889452B
公开(公告)日:2021-06-11
申请号:CN201910012933.5
申请日:2019-01-07
Applicant: 中国科学院计算技术研究所
IPC: H04L12/851 , H04L12/24 , H04L12/26 , H04L1/00
Abstract: 本发明涉及一种基于条件生成式对抗网络的网络背景流量生成方法,包括:数据获取步骤,获取的网络流量数据及条件信息,并向量化为真实流量;模型生成步骤,以该真实流量得到初始生成模型和判别模型,并通过条件生成式对抗网络以该判别模型对该初始生成模型进行训练,以得到生成模型;流量生成步骤,通过该生成模型以随机向量生成模拟背景流量。
-
公开(公告)号:CN112667221A
公开(公告)日:2021-04-16
申请号:CN202011249093.3
申请日:2020-11-10
Applicant: 中国科学院计算技术研究所
Abstract: 本发明提出一种基于深度学习开发IDE的深度学习模型构建方法及系统,本发明不仅支持多种不同的深度学习框架,可以让用户以简单的方式选择不同的框架进行模型的训练或推断而不引入额外的类似启动容器的开销;同时通过提供模型转换以支持不同框架模型的可视化,并支持以文本和可视化联调的方式实现实施模型结构的编辑。本发明的IDE较现有方法提供了更简单、方便且全面的开发环境。
-
公开(公告)号:CN108874849B
公开(公告)日:2020-12-25
申请号:CN201810097136.7
申请日:2018-01-31
Applicant: 中国科学院计算技术研究所
IPC: G06F16/2453
Abstract: 本发明公开了一种非等值关联子查询的优化方法和系统,其特征在于,包括:获取关联子查询的外表关联列的取值集;根据该关联子查询中操作符的类型和该取值集,建立该关联子查询的外表关联列到内表关联列分区的映射关系;根据得到的分区集合,对该关联子查询的内表进行分区,同时依据该关联子查询中内表的查询聚合函数,获取关联子查询在各分区的中间结果状态信息;根据该映射关系,遍历该外表关联列,通过聚合对应的分区集的中间结果状态信息,得到外表中各关联列对应的子查询结果。本发明具有的技术效果包括:通过对内表进行分区,并重复利用各分区的中间结果从而得到最终的子查询结果集,以提升查询性能。
-
公开(公告)号:CN111897908A
公开(公告)日:2020-11-06
申请号:CN202010398752.3
申请日:2020-05-12
Applicant: 中国科学院计算技术研究所
IPC: G06F16/31 , G06F16/35 , G06F16/36 , G06F40/211 , G06F40/289 , G06F40/295 , G06N3/04
Abstract: 本发明提出一种融合依存信息和预训练语言模型的事件抽取方法及系统,包括以句子的依存句法树为输入,利用使用图卷积神经网络学习依存句法特征,并加入依存关系预测任务,通过多任务学习的方式捕捉更重要的依存关系,最后使用BERT预训练语言模型增强底层句法表达,完成中文句子的事件抽取。由此本发明对事件抽取任务下触发词抽取和论元抽取的性能均有所提高。
-
公开(公告)号:CN111259658A
公开(公告)日:2020-06-09
申请号:CN202010080710.5
申请日:2020-02-05
Applicant: 中国科学院计算技术研究所
IPC: G06F40/279 , G06F40/216 , G06K9/62
Abstract: 本发明提出一种基于类别稠密向量表示的通用文本分类方法及系统,包括:获取包括以标记类别文本的训练数据,使用全连接网络处理该训练数据,得到各类别的类别稠密向量;将待分类文本输入至深度神经网络,得到该待分类文本中每个词的词稠密向量,并集合该词稠密向量得到该待分类文本的文本稠密向量;将该文本稠密向量和该类别稠密向量输入至匹配度测量模型,得到该待分类文本属于各类别的概率分布,将该待分类文本与该概率分布中概率最大的类别相匹配,作为该待分类文本的分类结果。本发明基于类别稠密向量表示,将文本分类问题转化为文本匹配问题,通过计算输入文本与每个类别之间的匹配程度,将文本分到匹配程度最大的类别之中。
-
公开(公告)号:CN110532072A
公开(公告)日:2019-12-03
申请号:CN201910672072.3
申请日:2019-07-24
Applicant: 中国科学院计算技术研究所
Abstract: 本发明提出一种基于微内核操作系统的分布式流式数据处理方法及系统,包括:获取包含用户定义函数的作业代码,并以该用户定义函数作为节点将该作业代码转换为有向无环图,并根据该有向无环图中算子之间的关联度,将该有向无环图中算子进行合并,得到任务逻辑视图;根据分布式微内核操作系统的物理执行环境,将该任务逻辑视图转换为执行图,该分布式微内核操作系统中工作节点收到该执行图,并将该执行图内的作业任务与作业调度分配至空闲CPU内核执行。与现有技术相比,本发明具有端到端处理延迟低,且吞吐量高,系统镜像体积小,启动时间短的技术进步。
-
公开(公告)号:CN109684349A
公开(公告)日:2019-04-26
申请号:CN201811383695.0
申请日:2018-11-20
Applicant: 中国科学院计算技术研究所
IPC: G06F16/242 , G06F16/245
Abstract: 本发明涉及一种基于SQL与图计算交互式分析的查询方法和系统,包括:根据标准结构化查询语句对数据库中的节点表和边表进行筛选,得到原始节点集和原始边集,根据类结构化查询语句涉及的图计算算法将原始边集转换为图计算算法所需数据结构,原始节点集和原始边集进行连接查询的迭代计算,不断更新节点集,直至算法的迭代终止条件触发,从而得到图计算的最终结果,并将最终结果作为查询结果输出。本发明在已有的关系型数据查询语言SQL中嵌入图查询与图计算方法,既可发挥SQL数据处理与分析的优势,又可进行图查询与计算。
-
公开(公告)号:CN109271524A
公开(公告)日:2019-01-25
申请号:CN201810870053.7
申请日:2018-08-02
Applicant: 中国科学院计算技术研究所
IPC: G06F16/36 , G06F16/332
Abstract: 本发明提供一种知识库问答系统中的实体链接方法,包括:从问句中获取主题词集合;根据获取的主题词集合在知识库中进行搜索,得到初步候选实体集合;对于所述初步候选实体集合中的每个实体,从该实体、所述问句以及所述知识库提取相应的特征;以及,根据提取到的所述初步候选实体集合中的每个实体的特征,得到该实体的评分,并且根据评分得到候选实体集合;本发明提高了实体链接的准确性和效率。
-
-
-
-
-
-
-
-
-