基于迭代图注意力网络的用户兴趣预测方法及电子装置

    公开(公告)号:CN112380427B

    公开(公告)日:2022-07-08

    申请号:CN202011159408.5

    申请日:2020-10-27

    Abstract: 本发明公开了一种基于迭代图注意力网络的用户兴趣预测方法及电子装置,通过未知兴趣标签分布与兴趣标签联合依赖概率,将用户特征学习的图注意力网络GATθ与兴趣潜在关系建模的图注意力网络相结合,并引入标签传播机制捕捉兴趣标签的局部依赖关系,对用户网络中的各用户兴趣进行预测。本发明,弥补了目前主流的用户兴趣预测方法对兴趣潜在关系建模的空缺,充分利用用户社交关系数据,预测准确率更高,并且高效快捷。

    一种基于序列化证据抽取的推理阅读理解方法及系统

    公开(公告)号:CN112347756A

    公开(公告)日:2021-02-09

    申请号:CN202011051087.7

    申请日:2020-09-29

    Abstract: 本发明涉及一种基于序列化证据抽取的推理阅读理解方法及系统。该方法训练基于序列化证据抽取的阅读理解模型,该模型包括编码层、推理交互层、证据预测层、答案预测层;利用训练完成的基于序列化证据抽取的阅读理解模型,输入上下文文本和问题文本,输出答案的类型、答案文本以及相关证据句子的集合。本发明通过GRU与注意力机制根据问题句子来序列化抽取证据文档中的句子作为证据句子的预测结果,将证据句子之间的相关关系考虑进去,逐步推理得到相关证据,同时覆盖问题中的重要信息。本发明从原来的独立预测每个证据句子变为序列化抽取证据句子,从而建模证据之间的相关性认证,从而提高了网络的安全可靠性。

    基于随机森林的图文数据融合情感分类方法和装置

    公开(公告)号:CN109934260A

    公开(公告)日:2019-06-25

    申请号:CN201910098349.6

    申请日:2019-01-31

    Abstract: 本发明涉及一种基于随机森林的图文数据融合情感分类方法和装置。该方法的步骤包括:1)提取多模态数据中图片的特征和文本的特征;2)将提取的图片的特征与文本的特征进行合并,得到图文整体特征;3)通过Corruption机制对图文整体特征进行特征选择;4)通过随机森林分类器对进行特征选择后的图文整体特征进行分类,得到情感分类结果。优选地,通过VGG-ISC网络提取多模态数据中图片的特征,通过CNN-TSC网络提取多模态数据中文本的特征。本发明可以有效的获取到单个模态上的特征,并且可以将二者的特征向量合并起来,作为一个整体的特征放入随机森林进行分类学习并进行情感分类。

    一种基于多层感知的问题答案抽取方法及电子装置

    公开(公告)号:CN112380326B

    公开(公告)日:2022-07-08

    申请号:CN202011079727.5

    申请日:2020-10-10

    Abstract: 本发明提供一种基于多层感知的问题答案抽取方法,其步骤包括:将一问题与若干目标文档拼接,输入到预训练语言模型中,得到问题的表示Q与目标文档的上下文表示P,将表示Q与上下文表示P交互,得到文档相关的问题表示u与融合问题信息的文档表示h;对问题表示u进行多层感知分类,获取问题的推理类型,并根据推理类型、问题表示u、文档表示h及通过表示Q生成的子问题ct,得到所述问题在目标文档中的答案注意力分布,其中t为生成子问题的次数;依据答案注意力分布,获取该问题的答案预测结果。本发明以子问题拆分的形式递进回答问题,引入推理类别分类器控制拆分,对问题的回答进行共享,提升推理阅读理解效果。

    一种基于多模态词向量的生成式对话系统编码方法及编码器

    公开(公告)号:CN110569499A

    公开(公告)日:2019-12-13

    申请号:CN201910648554.5

    申请日:2019-07-18

    Abstract: 本发明公开了一种基于多模态词向量的生成式对话系统编码方法及编码器。本方法为:1)根据当前语料与单词的上下文语境训练多模态词向量,其中每个单词生成多个词向量;2)使用双向LSTM神经网络与词向量对问句进行编码,然后将每个单词对应的前向神经网络的隐层状态与后向神经网络的隐层状态进行拼接作为该单词的上下文表示;3)将该单词的上下文表示与该单词的每一词向量分别计算相关度得分,取得分最高的词向量作为该单词的词向量;4)使用LSTM与该问句的各单词词向量对该问句进行编码,得到该问句的分布表示;5)对该问句的分布进行随机采样得到该问句的编码。本发明提高了句子编码的精准性。

    融合实体和句子推理信息的问题答案提取方法及电子装置

    公开(公告)号:CN112380835B

    公开(公告)日:2024-02-20

    申请号:CN202011078614.3

    申请日:2020-10-10

    Abstract: 本发明提供一种融合实体和句子推理信息的问题答案提取方法及电子装置,包括:将一问题与若干目标文档拼接,输入预训练语言模型,得到问题表示Q与文档上下文表示C;获取融合文档信息的问题表示Q0与融合问题信息的文档表示C0;依据问题表示Q(t‑1)与文档表示Ct‑1,获取实体图节点集合E(t‑1)与句子图节点集合#imgabs0#并采用图注意力网络对实体图与句子图更新,获取问题表示Q(t)与文档表示Ct;对实体图节点集合E(t)与句子图节点集合#imgabs1#融合并与文档表示Ct交互;依据推理更新后上下文表示C′(t),获取问题答案预测结果。本发明提出引入句子节点的图神经网络,通过门机制将实体表示与句子表示融合,利用句子级别推理信息弥补实体推理信息的缺失,提升推理阅读理解任务的性能。

    一种基于搜索引擎返回结果的谣言检测方法及电子装置

    公开(公告)号:CN112256861B

    公开(公告)日:2023-09-26

    申请号:CN202010929737.7

    申请日:2020-09-07

    Abstract: 本发明提供一种基于搜索引擎返回结果的谣言检测方法及电子装置,包括:依据一原文的内容,检索得到若干文档及相应发布来源,并从每一所述文档中选取若干单词组成一证据文档;拼接原文、原文发布人与每一证据文档及相应发布来源,得到一文本集合,并将所述文本集合输入到预训练语言模型,得到原文和证据文档之间的相关性特征;依据相关性特征对原文进行分类,判断原文是否为谣言。本发明未使用特征工程和领域知识,从外部证据文章中捕获对谣言检测有帮助的词句,训练数据获得难度极低,准确率优于现有方法。

Patent Agency Ranking