Patent search ap:("中国科学院自动化研究所") AND inv:"杨国花" Page 2

11.

发明公开
非结构化文本事件抽取方法有权

公开(公告)号：CN113407660A

公开(公告)日：2021-09-17

申请号：CN202110934216.5

申请日：2021-08-16

Applicant: 中国科学院自动化研究所

Inventor： 陶建华 , 吴家帆 , 张大伟 , 杨国花 , 刘通

IPC: G06F16/31 , G06F16/33 , G06F16/335 , G06F16/35 , G06F40/14 , G06F40/295 , G06F40/30 , G06N3/04 , G06N3/08

Abstract: 本发明提供非结构化文本事件抽取方法，包括：通过利用多阶句法树和图神经网络对文本信息进行编码，得到更为丰富和表征能力更强的词特征向量，进而提升事件检测的能力；通过构建外部本体知识，融入到候选事件论元编码环节，增加论元词汇特征编码的差异性，从而提升事件论元识别准确率。

12.

发明授权
基于近似本体匹配的知识图谱融合方法有权

公开(公告)号：CN113032516B

公开(公告)日：2021-08-31

申请号：CN202110581624.7

申请日：2021-05-27

Applicant: 中国科学院自动化研究所

Inventor： 陶建华 , 马秉政 , 张大伟 , 刘通 , 杨国花

IPC: G06F16/31 , G06F16/35 , G06F16/36 , G06F40/289 , G06F40/295 , G06K9/62

Abstract: 本发明提供基于近似本体匹配的知识图谱融合方法，包括：对待融合的知识图谱的集合进行初始化，构建倒排索引，依据所述倒排索引获取本体的共现情况，获取近似匹配本体，根据近似匹配本体提取候选实体对，在名称候选实体对集合和近似匹配本体集合中计算候选实体对在属性上的相似度，根据相似度向量的分量对候选实体初步判别，利用实体的文本特征对所述歧义实体和近义实体进行二次筛选；通过对于知识图谱的本体层进行粗筛，依据筛选结果对计算过程分块，达到缩减计算规模的目的。在各块内利用属性、名称、文本等特征计算实体相似度。

13.

发明公开
基于孪生网络的远程监督关系抽取降噪系统有权

公开(公告)号：CN112668342A

公开(公告)日：2021-04-16

申请号：CN202110024800.7

申请日：2021-01-08

Applicant: 中国科学院自动化研究所

Inventor： 陶建华 , 霍文帅 , 张大伟 , 杨国花 , 刘通

IPC: G06F40/30 , G06F40/289 , G06F16/36 , G06F16/35 , G06K9/62 , G06N3/04 , G06N3/08

Abstract: 本申请实施例涉及一种基于孪生网络的远程监督关系抽取降噪系统，旨在旨在降低远程监督回标训练数据的噪声影响，同时减少训练数据损失的情况。该系统包括：文本分析模块，关系选择器训练模块，关系选择模块，噪声数据聚类模块，关系分类模块；所述文本分析模块用于接收远程监督回标文本数据，输出初始候选数据和初始高可信度数据；所述关系选择器训练模块用于利用标注好的文本数据训练出基于孪生网络的关系选择器；所述关系选择模块用于对初始候选数据和初始高可信度数据进行关系选择，输出噪声数据和新增高可信度数据；所述噪声聚类模块用于对噪声数据进行聚类分析，输出新增候选数据，所述关系分类模块用于输出最后的分类结果。

14.

发明公开
一种基于特征和注意力机制融合的事件联合抽取系统有权

公开(公告)号：CN114298053A

公开(公告)日：2022-04-08

申请号：CN202210230832.7

申请日：2022-03-10

Applicant: 中国科学院自动化研究所

Inventor： 陶建华 , 沈超 , 张大伟 , 杨国花 , 车飞虎

IPC: G06F40/295 , G06F40/30 , G06K9/62 , G06N3/04 , G06N3/08

Abstract: 本发明提供一种基于特征和注意力机制融合的事件联合抽取系统，包括：输入层、特征提取层、触发词和论元识别层和事件后处理层；将预训练层输出的信息结合词性和位置信息输入到BiGRU和CNN中，得到句子的上下文语义特征矩阵和局部特征矩阵，再利用注意力机制融合这两种特征，最后将三种表示联合起来进行事件抽取；词嵌入层使用预训练模型BioBERT，并对其进行微调，以提高模型的效果；事件联合抽取，避免了级联错误的产生，提升模型的效果。

15.

发明公开
一种基于异质子图神经网络的相似信息检索方法和系统有权

公开(公告)号：CN114168804A

公开(公告)日：2022-03-11

申请号：CN202111550920.7

申请日：2021-12-17

Applicant: 中国科学院自动化研究所

Inventor： 陶建华 , 槐泽鹏 , 杨国花 , 张大伟 , 李冠君

IPC: G06F16/901 , G06F16/903 , G06F16/9535 , G06N3/04 , G06N3/08

Abstract: 本发明提出一种基于异质子图神经网络的相似信息检索方法和系统。其中，方法包括：首先，将业务场景数据面向异质图进行图结构化数据，即构建异质图；其次，设计了一种子图范式，据此设计异质子图神经网络，建模和学习中心节点的邻域信息，并在不需要交互记录等标签的低资源情况下进行模型训练，从而得到节点的嵌入表示；最后，设计了基于局部敏感哈希的快速相似度计算模块来实现对相似内容检索这一功能的在线服务。本发明能够解决了低资源场景下相似信息检索这一业务需求。

16.

发明授权
基于预训练模型的交叉聚焦损失的溯因推理方法有权

公开(公告)号：CN113283605B

公开(公告)日：2021-11-09

申请号：CN202110841128.0

申请日：2021-07-26

Applicant: 中国科学院自动化研究所

Inventor： 陶建华 , 徐铭 , 杨国花 , 张大伟 , 刘通

IPC: G06N5/04 , G06N3/04

Abstract: 本发明提供基于预训练模型的交叉聚焦损失的溯因推理方法，包括：将观测对O1和O2与所有假设的结合，得到输入序列；将输入序列中的单一输入变量输入预训练模型，得到对应句子级别的特征矩阵，然后对特征矩阵的单词维度求和，得到特征向量；遍历输入序列中所有单一输入变量，得到特征向量序列；将特征向量序列输入双向长短期记忆网络，获取到分布式特征表示，再利用全连接层进行映射求和得到每个输入的分数；将输入序列中N个标签为真的值分别与所有标签为假的值组成N组，并进行组内softmax，得到交叉预测值；引入聚类因子和引入权重因子，改进FocalLoss，得到训练损失函数；优化所述训练损失函数，得到最优的溯因推理模型。

17.

发明公开
基于力导向的知识图谱可视化方法无效

公开(公告)号：CN113254670A

公开(公告)日：2021-08-13

申请号：CN202110665550.5

申请日：2021-06-16

Applicant: 中国科学院自动化研究所

Inventor： 陶建华 , 张大伟 , 王华东 , 刘通 , 杨国花 , 易江燕

IPC: G06F16/36 , G06F16/34 , G06N5/02

Abstract: 本发明提供基于力导向的知识图谱可视化方法，包括：知识图谱数据提取包括：知识图谱构建和知识图谱查询；构造图数据结构：对构建好的知识图谱查询得到的相关的节点和关系进行图数据结构格式转换；力导向算法布局：随机初始化所有节点在屏幕中的坐标；把节点作为电子，使节点彼此之间存在斥力；把关系作为弹簧，使节点彼此之间存在引力；在斥力和引力的作用下迭代n次，最终达到平衡状态，得到所有节点的稳定坐标；可视化呈现：根据所有节点的稳定坐标，分别绘制节点以及节点之间的连线，得到最终知识图谱；运算流程可视化交互：通过最终知识图谱，为每个节点和关系绑定监听事件，使用户能通过鼠标操作节点和关系。

18.

发明公开
一种基于张量分解的知识推理方法、装置、设备有权

公开(公告)号：CN113051404A

公开(公告)日：2021-06-29

申请号：CN202110024807.9

申请日：2021-01-08

Applicant: 中国科学院自动化研究所

Inventor： 陶建华 , 邵朋朋 , 刘通 , 杨国花 , 张大伟

IPC: G06F16/36 , G06F16/2455

Abstract: 本申请实施例涉及数据处理技术领域，具体涉及一种基于张量分解的知识推理方法、装置、设备，旨在提高时序知识推理任务的准确率。所述方法包括：对时序知识图谱数据集中的数据进行提取，得到多组四元组数据，多组四元组数据中的每组四元组数据中包含了头实体、关系、尾实体以及时间；对多组四元组数据进行标注及处理，将处理好的四元组数据作为训练材料；将训练材料输入基于张量分解的时序知识推理模型及其变体模型中，利用梯度下降算法对时序知识推理模型及其变体模型分别进行训练，得到训练好的时序知识推理模型及其变体模型；使用训练好的时序知识推理模型及其变体模型分别执行预测任务，推理问题的答案，得到最终的推理结果。

19.

发明授权
基于孪生网络的远程监督关系抽取降噪系统有权

公开(公告)号：CN112668342B

公开(公告)日：2024-05-07

申请号：CN202110024800.7

申请日：2021-01-08

Applicant: 中国科学院自动化研究所

Inventor： 陶建华 , 霍文帅 , 张大伟 , 杨国花 , 刘通

IPC: G06F40/30 , G06F40/289 , G06F16/36 , G06F16/35 , G06F18/23213 , G06N3/0464 , G06N3/08

Abstract: 本申请实施例涉及一种基于孪生网络的远程监督关系抽取降噪系统，旨在旨在降低远程监督回标训练数据的噪声影响，同时减少训练数据损失的情况。该系统包括：文本分析模块，关系选择器训练模块，关系选择模块，噪声数据聚类模块，关系分类模块；所述文本分析模块用于接收远程监督回标文本数据，输出初始候选数据和初始高可信度数据；所述关系选择器训练模块用于利用标注好的文本数据训练出基于孪生网络的关系选择器；所述关系选择模块用于对初始候选数据和初始高可信度数据进行关系选择，输出噪声数据和新增高可信度数据；所述噪声聚类模块用于对噪声数据进行聚类分析，输出新增候选数据，所述关系分类模块用于输出最后的分类结果。

20.

发明授权
一种基于张量分解的知识推理方法、装置、设备有权

公开(公告)号：CN113051404B

公开(公告)日：2024-02-06

申请号：CN202110024807.9

申请日：2021-01-08

Applicant: 中国科学院自动化研究所

Inventor： 陶建华 , 邵朋朋 , 刘通 , 杨国花 , 张大伟

IPC: G06F16/36 , G06F16/2455

Abstract: 本申请实施例涉及数据处理技术领域，具体涉及一种基于张量分解的知识推理方法、装置、设备，旨在提高时序知识推理任务的准确率。所述方法包括：对时序知识图谱数据集中的数据进行提取，得到多组四元组数据，多组四元组数据中的每组四元组数据中包含了头实体、关系、尾实体以及时间；对多组四元组数据进行标注及处理，将处理好的四元组数据作为训练材料；将训练材料输入基于张量分解的时序知识推理模型及其变体模型中，利用梯度下降算法对时序知识推理模型及其变体模型分别进行训练，得到训练好的时序知识推理模型及其变体模型；使用训练好的时序知识推理模型及其变体模型分别执行预测任务，推理问题的答案，得到最终的推理结果。

Search Results

Country/Region

Patent validity

Application date

Publication (announcement) day

applicant

The country/region where the applicant is located

Inventor

IPC

IPC Department

IPC class

IPC subclass

IPC group

IPC team

Appearance classification