基于多源语义表示融合的弱监督关系抽取方法

    公开(公告)号:CN111737497B

    公开(公告)日:2021-07-20

    申请号:CN202010607265.3

    申请日:2020-06-30

    Abstract: 本发明提供一种基于多源语义表示融合的弱监督关系抽取方法。首先,采用分布式词向量初始化文本语句的上下文语义特征,运用自然语言处理工具解析出描述文本特性的海量离散化符号特性,并设计关系抽取任务中语句实例与特性间通用的一阶逻辑规则。之后,将逻辑规则与因子图相结合以建立文本特性与语句实例间的联系,并通过联合统计推理从人类感知的角度建模,学习描述文本特性的低维关系语义向量;并使用双向门控循环单元编码语句内容本身的语义信息作为上下文内容语义向量。最后,在神经网络中微调文本特性语义向量,融合两种不同特征源的向量表示得到更具鲁棒性的文本语义特征表示,与实体对嵌入表征一同指导弱监督关系抽取工作。

    一种实体对齐的主动学习框架方法

    公开(公告)号:CN113792888A

    公开(公告)日:2021-12-14

    申请号:CN202111091377.9

    申请日:2021-09-17

    Abstract: 本发明提出一种实体对齐的主动学习框架方法,从缩小实体对齐的范围出发,考虑生产环境中缺少标签数据的问题,使用多角度的两个学习引擎相互对抗和增强的方式,对模型进行训练,以完成实体对齐任务。该方法主要包括:实体分块、训练集生成、主动学习过程和候选集生成与预测。主动学习过程中包含对实体的不同侧重的模型,可以分别考虑实体的属性和关系。同时对无标签数据的指标难以测量问题,提出使用继续训练这一方式进行补足,从而满足实体对齐模型在不损失性能的同时在无标签数据的情况下的应用。

    基于全局图注意力和局部图注意力的论文摘要生成方法

    公开(公告)号:CN113656598A

    公开(公告)日:2021-11-16

    申请号:CN202110952568.3

    申请日:2021-08-19

    Abstract: 一种基于全局图注意力和局部图注意力的论文摘要生成方法,从输入的知识图中,通过全局图注意力和局部图注意力提取图结构特征,应用于指导论文摘要生成,该方法可以更好抓住各个实体间的关系,提高论文摘要生成效果。该方法主要包括:图结构转换、特征提取、解码生成。将知识图的每一条边,替换成两个表示关系方向的节点,将原图转换成连通无向图;通过多头自注意力计算顶点与图中其它顶点的注意力分布更新节点向量,获取全局特征表示;之后通过多头自注意力计算顶点与直接相连顶点的注意力分布更新节点向量,获取局部细节特征;最后在解码生成部分使用复制机制,从知识图中复制输入信息作为输出。

    基于因果干预的知识表示学习模型置信度测量方法

    公开(公告)号:CN113656597A

    公开(公告)日:2021-11-16

    申请号:CN202110952561.1

    申请日:2021-08-19

    Abstract: 一种基于因果干预的知识表示学习模型置信度测量方法。该方法主动干预输入实体的向量维度数值,构造输入实体向量的多个邻域干预向量,从而有效地估计每个预测三元组的置信度。通过将原始实体向量和邻域干预向量分别输入到知识表示学习模型中,得到模型输出的预测结果。进而计算邻域干预向量的预测结果一致性系数,通过评估干预前后预测结果的稳健性来推断预测置信度。在大规模知识图谱构建和维护工程中,该方法可以大幅度降低知识三元组判别工作中的人工成本,有效提高知识图谱补全和更新的精度和效率,使得知识图谱可以保持高质量知识表征,在人工智能、学术分析、社交网络等多个领域具有较高的应用前景。

    基于变分循环网络模型的信念一致多智能体强化学习方法

    公开(公告)号:CN114037048B

    公开(公告)日:2024-05-28

    申请号:CN202111200399.4

    申请日:2021-10-15

    Abstract: 本发明提供一种基于变分循环网络模型的信念一致多智能体强化学习方法,该方法启发于人类团队之间的可以产生默契合作的现象,即通过共同的信念在任务上达成一致性共识。与人类社会群体类似,分布式学习系统中的智能体也可以受益于一致的信念,在有限的通信条件下实现协作。在本文中,我们展示了在分散式协作任务中智能体之间的一致性信念的作用。我们提出了一种新的基于值的方法——一致性信念多智能体强化学习方法,它使用变分模型来学习智能体之间的信念。我们还利用与变分模型结合的循环网络模型(RNN)充分利用智能体历史行为轨迹。我们的算法使智能体能够学习一致的信念,以优化完全分散的策略。我们在两个网格世界游戏以及星际争霸II微观管理基准上验证了该方法。我们的实验结果表明,该方法学习到的共同信念可以有效提高离散和连续状态下的智能体的协作效果。

    一种面向百科数据的作战事件抽取方法

    公开(公告)号:CN113806481B

    公开(公告)日:2022-11-04

    申请号:CN202111091000.3

    申请日:2021-09-17

    Abstract: 本发明提出一种面向百科数据的作战事件抽取方法,从军事相关的百科文本出发,使用BERT字向量和后缀特征、实体注意力机制等多种方法提升作战事件抽取性能。该方法使用BERT+Bi‑GRU+CRF为基础框架,使用后缀特征抽取军事实体,使用军事实体注意力机制抽取作战事件触发词,完成作战事件抽取。本发明提出的方法通过后缀特征和军事实体注意力机制的引入,分别在军事实体识别和事件触发词抽取任务上提升2%和1.3%的F‑值;可以应用于军事作战事理图谱构建等多个领域,利用该方法产生的作战事件数据为作战规律分析、智能作战决策系统研发提供数据支持。

    基于多源语义表示融合的弱监督关系抽取方法

    公开(公告)号:CN111737497A

    公开(公告)日:2020-10-02

    申请号:CN202010607265.3

    申请日:2020-06-30

    Abstract: 本发明提供一种基于多源语义表示融合的弱监督关系抽取方法。首先,采用分布式词向量初始化文本语句的上下文语义特征,运用自然语言处理工具解析出描述文本特性的海量离散化符号特性,并设计关系抽取任务中语句实例与特性间通用的一阶逻辑规则。之后,将逻辑规则与因子图相结合以建立文本特性与语句实例间的联系,并通过联合统计推理从人类感知的角度建模,学习描述文本特性的低维关系语义向量;并使用双向门控循环单元编码语句内容本身的语义信息作为上下文内容语义向量。最后,在神经网络中微调文本特性语义向量,融合两种不同特征源的向量表示得到更具鲁棒性的文本语义特征表示,与实体对嵌入表征一同指导弱监督关系抽取工作。

    基于全局图注意力和局部图注意力的论文摘要生成方法

    公开(公告)号:CN113656598B

    公开(公告)日:2024-12-03

    申请号:CN202110952568.3

    申请日:2021-08-19

    Abstract: 一种基于全局图注意力和局部图注意力的论文摘要生成方法,从输入的知识图中,通过全局图注意力和局部图注意力提取图结构特征,应用于指导论文摘要生成,该方法可以更好抓住各个实体间的关系,提高论文摘要生成效果。该方法主要包括:图结构转换、特征提取、解码生成。将知识图的每一条边,替换成两个表示关系方向的节点,将原图转换成连通无向图;通过多头自注意力计算顶点与图中其它顶点的注意力分布更新节点向量,获取全局特征表示;之后通过多头自注意力计算顶点与直接相连顶点的注意力分布更新节点向量,获取局部细节特征;最后在解码生成部分使用复制机制,从知识图中复制输入信息作为输出。

    基于三元损失训练策略的生物医学实体关系抽取方法

    公开(公告)号:CN114238561B

    公开(公告)日:2024-08-13

    申请号:CN202111455875.7

    申请日:2021-12-01

    Abstract: 本发明公开了一种基于三元损失训练策略的生物医学实体关系抽取方法,该方法主要包括:三元数据生成,句子级特征和实体级特征提取,关系分类。首先使用三元数据生成规则得到合法的三元数据;之后使用基于Bert的神经网络模型抽取每个实例的句子级特征和实体级特征;接着基于句子级和实体级特征向量计算模型三元损失进行模型训练;在训练结束后可以直接使用模型得到的特征向量进行关系分类,从而得到实体对关系类别。本发明能够避免将“来自同一个句子但属于不同类别”的实例错分为同一类的情况,更好的提升关系分类的准确率。

    基于三元损失训练策略的生物医学实体关系抽取方法

    公开(公告)号:CN114238561A

    公开(公告)日:2022-03-25

    申请号:CN202111455875.7

    申请日:2021-12-01

    Abstract: 本发明公开了一种基于三元损失训练策略的生物医学实体关系抽取方法,该方法主要包括:三元数据生成,句子级特征和实体级特征提取,关系分类。首先使用三元数据生成规则得到合法的三元数据;之后使用基于Bert的神经网络模型抽取每个实例的句子级特征和实体级特征;接着基于句子级和实体级特征向量计算模型三元损失进行模型训练;在训练结束后可以直接使用模型得到的特征向量进行关系分类,从而得到实体对关系类别。本发明能够避免将“来自同一个句子但属于不同类别”的实例错分为同一类的情况,更好的提升关系分类的准确率。

Patent Agency Ranking