一种基于知识图谱与语义图技术的口语理解方法

    公开(公告)号:CN110188342A

    公开(公告)日:2019-08-30

    申请号:CN201910315854.1

    申请日:2019-04-19

    Abstract: 本发明公开了一种基于知识图谱与语义图技术进行口语理解的方法。本发明步骤:1.训练序列到动作序列神经网络模型,训练基于句子和句子逻辑表达式的口语理解神经网络;2.读取需要被解析的自然语言句子;3.使用文本映射算法扫描并替换句子中与知识图谱中语义资源相匹配的部分;4.使用序列到动作序列神经网络模型读取替换了语义资源后的句子,然后执行对应的动作序列生成与句子语义相符的语义图,然后使用深度优先算法遍历语义图得到句子的逻辑表达式;5.使用口语理解神经网络读入句子和逻辑表达式,生成意图信息和槽位信息。本发明提出结合知识图谱和理解句子语义的方法进行口语解析。

    基于句内词对关系和上下文用户特征的反讽检测方法

    公开(公告)号:CN110162625A

    公开(公告)日:2019-08-23

    申请号:CN201910315886.1

    申请日:2019-04-19

    Abstract: 本发明公开了一种基于句内词对关系和上下文用户特征的反讽检测方法。本发明用自注意力机制(也称内部注意力机制)去分析文本中情感极性矛盾的词对。通过学习并融合用户的书写风格特征和性格特征得到用户嵌入(user embeddings),作为反讽检测的上下文信息。同时结合LSTM网络编码文本的序列信息。这种方法能够更好的检测反讽表达,在反讽表达明显或者隐晦的情况下都可以取得不错的准确率。其中具体发明的基于句内词对关系和上下文用户特征的反讽检测模型。本发明为反讽检测提供判别依据,有利于判别没有明显矛盾词对的反讽文本。从这两个角度提高了反讽检测的准确率。

    一种融合注意力机制的神经网络事件抽取方法

    公开(公告)号:CN109710919A

    公开(公告)日:2019-05-03

    申请号:CN201811428287.2

    申请日:2018-11-27

    Abstract: 本发明公开了一种融合注意力机制的神经网络事件抽取方法。本发明实现步骤如下:步骤(1)预处理训练样本和待提取事件文本;步骤(2)使用预处理好的训练样本训练协同上下文注意力机制的双向GRU网络;步骤(3)将待提取事件文本输入训练好的神经网络,输出提取出的事件触发词和预测的事件类型;本发明利用上下文注意力机制协同双向GRU网络对文本进行分析,提高了事件触发词识别中多义词的识别能力,这种方法具有更准确的事件分类的能力。

    一种最长匹配资源映射方法

    公开(公告)号:CN110175268B

    公开(公告)日:2020-01-17

    申请号:CN201910315880.4

    申请日:2019-04-19

    Abstract: 本发明公开了一种最长匹配资源映射方法。本发明主要为了解决从文本中检测知识库和知识图谱中的资源时,难以检测复合语义资源的问题。本发明采用的技术方案是,为待检测的语句解析为词语流,为每一个词语寻找与其相关的语义资源,然后寻找尽可能多的与原始句子中词语相关的语义资源作为资源映射的结果。同时,为了提升分类的效率,本发明在语句被进行资源映射处理之前对文本做了一定的预处理,提高了检索效率。本发明针对复合语义资源在短语检测和资源映射阶段难以得到合理映射的问题,提出针对邻域中的多个词语的组合资源映射方案,提高了多个词语映射到一个复合语义资源的问题。同时,通过一定的索引优化,提高了查询效率。

    一种基于多头注意力机制的事件论元角色抽取方法

    公开(公告)号:CN110134757A

    公开(公告)日:2019-08-16

    申请号:CN201910315948.9

    申请日:2019-04-19

    Abstract: 本发明公开了一种基于多头注意力机制的事件论元角色抽取方法。本发明实现步骤如下:步骤(1)数据集文本预处理,输出预处理好的文本和对应的标签;步骤(2)训练融合多头监督注意力机制的双向GRU网络;步骤(3)对文本进行语义依存分析,输出触发词与候选论元之间的语义依存路径;步骤(4)将预处理好的文本输入步骤(2)中网络训练后输出每个词的编码,融合步骤(3)中的语义依存路径输出 论元分类结构;步骤(5)将论元分类结构输入分类网络训练并进行分类。本发明利用融合多头监督注意力机制的神经网络方法对文本进行分析,对事件句中存在多个事件情形具有良好的论元角色抽取能力。

    基于注意力机制的LSTM-CNN词嵌入的细粒度情感分类模型

    公开(公告)号:CN110096587A

    公开(公告)日:2019-08-06

    申请号:CN201910026957.6

    申请日:2019-01-11

    Abstract: 本发明公开了基于注意力机制的LSTM-CNN词嵌入的细粒度情感分类模型。本发明用一般的LSTM提取到的特征与指定角度的相关性不大导致情感分类准确率降低的问题。本发明采用的技术方案是,将CNN与LSTM进行结合,同时利用CNN识别局部特征的能力和LSTM利用文本序列的能力,用LSTM获取句子表示,将LSTM的输出馈送给CNN作为输入。通过CNN的卷积池化操作对LSTM提取到的特征进行选择,再引入注意力机制去重点关注句中与指定方面关联程度较高的信息,最后得到句子的预测极性。同时,为了提升分类的效率,本发明在模型中输入了指定角度的词嵌入向量,提高了分类准确率。

    基于注意力机制的LSTM-CNN词嵌入的细粒度情感分类模型

    公开(公告)号:CN110096587B

    公开(公告)日:2020-07-07

    申请号:CN201910026957.6

    申请日:2019-01-11

    Abstract: 本发明公开了基于注意力机制的LSTM‑CNN词嵌入的细粒度情感分类模型。本发明用一般的LSTM提取到的特征与指定角度的相关性不大导致情感分类准确率降低的问题。本发明采用的技术方案是,将CNN与LSTM进行结合,同时利用CNN识别局部特征的能力和LSTM利用文本序列的能力,用LSTM获取句子表示,将LSTM的输出馈送给CNN作为输入。通过CNN的卷积池化操作对LSTM提取到的特征进行选择,再引入注意力机制去重点关注句中与指定方面关联程度较高的信息,最后得到句子的预测极性。同时,为了提升分类的效率,本发明在模型中输入了指定角度的词嵌入向量,提高了分类准确率。

    一种基于知识图谱与语义图技术的口语理解方法

    公开(公告)号:CN110188342B

    公开(公告)日:2020-04-07

    申请号:CN201910315854.1

    申请日:2019-04-19

    Abstract: 本发明公开了一种基于知识图谱与语义图技术进行口语理解的方法。本发明步骤:1.训练序列到动作序列神经网络模型,训练基于句子和句子逻辑表达式的口语理解神经网络;2.读取需要被解析的自然语言句子;3.使用文本映射算法扫描并替换句子中与知识图谱中语义资源相匹配的部分;4.使用序列到动作序列神经网络模型读取替换了语义资源后的句子,然后执行对应的动作序列生成与句子语义相符的语义图,然后使用深度优先算法遍历语义图得到句子的逻辑表达式;5.使用口语理解神经网络读入句子和逻辑表达式,生成意图信息和槽位信息。本发明提出结合知识图谱和理解句子语义的方法进行口语解析。

    一种基于多头注意力机制的事件论元角色抽取方法

    公开(公告)号:CN110134757B

    公开(公告)日:2020-04-07

    申请号:CN201910315948.9

    申请日:2019-04-19

    Abstract: 本发明公开了一种基于多头注意力机制的事件论元角色抽取方法。本发明实现步骤如下:步骤(1)数据集文本预处理,输出预处理好的文本和对应的标签;步骤(2)训练融合多头监督注意力机制的双向GRU网络;步骤(3)对文本进行语义依存分析,输出触发词与候选论元之间的语义依存路径;步骤(4)将预处理好的文本输入步骤(2)中网络训练后输出每个词的编码,融合步骤(3)中的语义依存路径输出 论元分类结构;步骤(5)将论元分类结构输入分类网络训练并进行分类。本发明利用融合多头监督注意力机制的神经网络方法对文本进行分析,对事件句中存在多个事件情形具有良好的论元角色抽取能力。

    基于句内词对关系和上下文用户特征的反讽检测方法

    公开(公告)号:CN110162625B

    公开(公告)日:2020-01-14

    申请号:CN201910315886.1

    申请日:2019-04-19

    Abstract: 本发明公开了一种基于句内词对关系和上下文用户特征的反讽检测方法。本发明用自注意力机制(也称内部注意力机制)去分析文本中情感极性矛盾的词对。通过学习并融合用户的书写风格特征和性格特征得到用户嵌入(user embeddings),作为反讽检测的上下文信息。同时结合LSTM网络编码文本的序列信息。这种方法能够更好的检测反讽表达,在反讽表达明显或者隐晦的情况下都可以取得不错的准确率。其中具体发明的基于句内词对关系和上下文用户特征的反讽检测模型。本发明为反讽检测提供判别依据,有利于判别没有明显矛盾词对的反讽文本。从这两个角度提高了反讽检测的准确率。

Patent Agency Ranking