一种基于多模态词向量的生成式对话系统编码方法及编码器

    公开(公告)号:CN110569499B

    公开(公告)日:2021-10-08

    申请号:CN201910648554.5

    申请日:2019-07-18

    Abstract: 本发明公开了一种基于多模态词向量的生成式对话系统编码方法及编码器。本方法为:1)根据当前语料与单词的上下文语境训练多模态词向量,其中每个单词生成多个词向量;2)使用双向LSTM神经网络与词向量对问句进行编码,然后将每个单词对应的前向神经网络的隐层状态与后向神经网络的隐层状态进行拼接作为该单词的上下文表示;3)将该单词的上下文表示与该单词的每一词向量分别计算相关度得分,取得分最高的词向量作为该单词的词向量;4)使用LSTM与该问句的各单词词向量对该问句进行编码,得到该问句的分布表示;5)对该问句的分布进行随机采样得到该问句的编码。本发明提高了句子编码的精准性。

    一种层级对齐结构的问答立场检测方法及装置

    公开(公告)号:CN113127599A

    公开(公告)日:2021-07-16

    申请号:CN202110230676.X

    申请日:2021-03-02

    Abstract: 本发明公开了一种层级对齐结构的问答立场检测方法及装置,包括:分别将问题文本与回答文本转换为问题序列与回答序列;拼接问题序列与回答序列,得到问题回答序列;将问题序列、回答序列及问题回答序列输入层次对齐模型,得到问答立场检测结果。本发明的层次对齐模型,先使用了BERT预训练模型得到粗粒度的立场表示,然后从QA对中的问题和回答两方面进行了概念级别的目标对齐和证据级别的信息对齐,得到了由粗到精的立场表示,从而在问答立场检测任务上可以获得更高的准确率和F1值。

    基于迭代图注意力网络的用户兴趣预测方法及电子装置

    公开(公告)号:CN112380427A

    公开(公告)日:2021-02-19

    申请号:CN202011159408.5

    申请日:2020-10-27

    Abstract: 本发明公开了一种基于迭代图注意力网络的用户兴趣预测方法及电子装置,通过未知兴趣标签分布与兴趣标签联合依赖概率,将用户特征学习的图注意力网络GATθ与兴趣潜在关系建模的图注意力网络 相结合,并引入标签传播机制捕捉兴趣标签的局部依赖关系,对用户网络中的各用户兴趣进行预测。本发明,弥补了目前主流的用户兴趣预测方法对兴趣潜在关系建模的空缺,充分利用用户社交关系数据,预测准确率更高,并且高效快捷。

    一种基于搜索引擎返回结果的谣言检测方法及电子装置

    公开(公告)号:CN112256861A

    公开(公告)日:2021-01-22

    申请号:CN202010929737.7

    申请日:2020-09-07

    Abstract: 本发明提供一种基于搜索引擎返回结果的谣言检测方法及电子装置,包括:依据一原文的内容,检索得到若干文档及相应发布来源,并从每一所述文档中选取若干单词组成一证据文档;拼接原文、原文发布人与每一证据文档及相应发布来源,得到一文本集合,并将所述文本集合输入到预训练语言模型,得到原文和证据文档之间的相关性特征;依据相关性特征对原文进行分类,判断原文是否为谣言。本发明未使用特征工程和领域知识,从外部证据文章中捕获对谣言检测有帮助的词句,训练数据获得难度极低,准确率优于现有方法。

    基于同一特征空间的图文数据融合情感分类方法和装置

    公开(公告)号:CN109829499A

    公开(公告)日:2019-05-31

    申请号:CN201910097903.9

    申请日:2019-01-31

    Abstract: 本发明涉及一种基于同一特征空间的图文数据融合情感分类方法和装置。该方法的步骤包括:1)使用自动编码机提取多模态数据中图片的压缩特征表达;2)使用CNN-DCNN网络提取多模态数据中文字的压缩特征表达;3)将步骤1)、2)得到的图片特征和文本特征映射到同一个特征向量空间,得到图文整体特征;4)通过分类器对步骤3)得到的图文整体特征进行分类,得到情感分类结果。本发明将图、文特征映射到同一个空间下,再对整体信息进行情感分类,可以同时捕捉到微博等多模态数据的图、文数据之间语义相关性和情感相关性。

Patent Agency Ranking