一种基于细粒度提示学习和双向图卷积的关系抽取方法

    公开(公告)号:CN118747214A

    公开(公告)日:2024-10-08

    申请号:CN202310765924.X

    申请日:2023-06-27

    Abstract: 本发明公开了一种基于细粒度提示学习和双向图卷积的关系抽取方法,属于自然语言处理和信息抽取技术领域。本发明首先进行文本预处理,即在非结构化文本中插入实体多粒度标记符和提示学习模板;构建句子序列特征,生成句子序列特征表示;构建句子的依赖特征,生成句子的依赖特征表示;构建句子的混合嵌入表示,输出关系抽取结果。本发明引入了实体类型、实体词语的词法和上位词语义信息,增强了提示学习模板的词法和语义信息以及上下文语义表达能力;捕获了句子隐含的序列特征和依赖特征,挖掘了文本的多维度词法和语义特征,提高了关系抽取性能。

    基于多层次注意力和层次类别特征的小样本意图识别方法

    公开(公告)号:CN116049349A

    公开(公告)日:2023-05-02

    申请号:CN202211452106.6

    申请日:2022-11-21

    Abstract: 本发明涉及一种基于多层次注意力和层次类别特征的小样本意图识别方法,属于自然语言处理和问答系统技术领域。第一,引入词级、短语级、语义角色级别的三层注意力机制,从词频、反文档频率、类内分布均匀度、类间分布均匀度共四个角度融合层次类别特征,计算混合特征因子,充分挖掘不同层次、不同粒度、不同角度的文本特征,能够有效提升小样本意图识别的准确率。第二,不同于对样本表示取均值生成类别表示的方法,本发明基于胶囊网络中动态路由的思想,学习样本表示和类别表示之间的非线性映射关系,提高从样本中归纳学习类别表示的能力。

    一种基于异质融合网络的多模态情感分类方法

    公开(公告)号:CN113255755B

    公开(公告)日:2022-08-23

    申请号:CN202110538947.8

    申请日:2021-05-18

    Abstract: 本发明公开了一种基于异质融合网络的多模态情感分类方法,属于意见挖掘和情感分析技术领域。包括:1)视频数据预处理;2)构建文本特征向量和识别文本情感类别;3)构建图片特征向量和识别图片情感类别;4)构建音频特征向量和识别音频情感类别;5)构建多模态全局特征向量与识别多模态全局情感类别;6)构建多模态局部特征向量与识别多模态局部情感类别;7)采用投票策略获得最终的情感分类结果。异质融合网络采用了模态内融合和模态间融合两种融合形式,宏观和微观两种融合角度,以及特征层融合和决策层融合两种融合策略。所述方法能深度挖掘多模态数据之间隐含的关联信息,实现多模态数据之间的相互补充和融合,从而提高多模态情感分类的准确率。

    一种基于深度学习的实例对齐方法

    公开(公告)号:CN109697288B

    公开(公告)日:2020-09-15

    申请号:CN201811589849.1

    申请日:2018-12-25

    Abstract: 本发明公开了一种基于深度学习的实例对齐方法,属于信息融合及Web挖掘技术领域。本发明包括如下步骤:构建实例语料集;构建实例对集合;对实例对集合进行预处理;基于段落向量模型Doc2vec和词向量模型Word2vec生成实例对的特征向量;基于训练集实例对训练双向长短期记忆‑卷积神经网络模型;利用经过训练的双向长短期记忆‑卷积神经网络模型对测试集实例对进行实例对齐判别,输出实例对齐结果。本发明将实例对齐问题转换为分类问题,通过双向长短期记忆‑卷积神经网络模型判别实例对齐,提高了实例对齐的识别性能,在信息检索、问答系统、意见挖掘等领域具有广阔的应用前景。

    一种基于深度学习的实例对齐方法

    公开(公告)号:CN109697288A

    公开(公告)日:2019-04-30

    申请号:CN201811589849.1

    申请日:2018-12-25

    Abstract: 本发明公开了一种基于深度学习的实例对齐方法,属于信息融合及Web挖掘技术领域。本发明包括如下步骤:构建实例语料集;构建实例对集合;对实例对集合进行预处理;基于段落向量模型Doc2vec和词向量模型Word2vec生成实例对的特征向量;基于训练集实例对训练双向长短期记忆-卷积神经网络模型;利用经过训练的双向长短期记忆-卷积神经网络模型对测试集实例对进行实例对齐判别,输出实例对齐结果。本发明将实例对齐问题转换为分类问题,通过双向长短期记忆-卷积神经网络模型判别实例对齐,提高了实例对齐的识别性能,在信息检索、问答系统、意见挖掘等领域具有广阔的应用前景。

    一种基于文献内容知识图谱的多层引文推荐方法

    公开(公告)号:CN105653706B

    公开(公告)日:2018-04-06

    申请号:CN201511026567.7

    申请日:2015-12-31

    Abstract: 本发明公开了一种基于文献内容知识图谱的多层引文推荐方法,属于信息推荐和智能信息处理领域。本方法首先获取用户的查询需求,查询需求由需要推荐引用论文或引用文献的论文的标题和摘要的关键词构成。然后,基于文献内容的知识图谱扩展查询检索词语,知识图谱由文献的研究对象词语和研究行为词语结点,以及表示同义、近义、上下位、部分整体、并列等各种语义关系的边构成。最后,构建数据集中文献的倒排索引,选取候选引文,计算候选引文和查询的相似度,采用梯度渐进回归树来进行引文推荐。本方法基于文献内容知识图谱进行多层次的引文推荐,扩大了候选引文的范围,准确地表达了论文的研究对象和内容,提高了用户获取相关文献的效率,具有广阔的应用前景。

    一种基于多层集成学习的微博转发预测方法

    公开(公告)号:CN107590558A

    公开(公告)日:2018-01-16

    申请号:CN201710783927.0

    申请日:2017-09-04

    Abstract: 本发明一种基于多层集成学习的微博转发预测方法,属于社会网络分析和网络舆情监控领域。包括如下步骤:构建微博数据集;微博数据预处理;提取微博用户的个人特征和社交特征;提取微博用户的微博内容特征;采用基于贝叶斯的方法进行微博转发预测;采用基于支持向量机的方法进行微博转发预测;采用基于逻辑回归的方法进行微博转发预测;采用基于随机森林的方法进行微博转发预测;采用基于集成学习的方法进行微博转发预测。本发明提高了微博转发预测性能,在社会媒体处理、意见挖掘、信息安全等领域具有广阔的应用前景。

    一种基于文献内容知识图谱的多层引文推荐方法

    公开(公告)号:CN105653706A

    公开(公告)日:2016-06-08

    申请号:CN201511026567.7

    申请日:2015-12-31

    CPC classification number: G06F17/30619 G06F17/30699

    Abstract: 本发明公开了一种基于文献内容知识图谱的多层引文推荐方法,属于信息推荐和智能信息处理领域。本方法首先获取用户的查询需求,查询需求由需要推荐引用论文或引用文献的论文的标题和摘要的关键词构成。然后,基于文献内容的知识图谱扩展查询检索词语,知识图谱由文献的研究对象词语和研究行为词语结点,以及表示同义、近义、上下位、部分整体、并列等各种语义关系的边构成。最后,构建数据集中文献的倒排索引,选取候选引文,计算候选引文和查询的相似度,采用梯度渐进回归树来进行引文推荐。本方法基于文献内容知识图谱进行多层次的引文推荐,扩大了候选引文的范围,准确地表达了论文的研究对象和内容,提高了用户获取相关文献的效率,具有广阔的应用前景。

    一种决策级中文分词融合方法

    公开(公告)号:CN104317882A

    公开(公告)日:2015-01-28

    申请号:CN201410564432.5

    申请日:2014-10-21

    CPC classification number: G06F17/30613 G06F17/30864

    Abstract: 本发明公开了一种决策级中文分词融合方法,属于自然语言处理和智能信息处理领域。本方法首先利用三种分词工具对中文文本中的句子进行分词,并对分词结果进行预处理,利用整型数组保存每个分词工具的分词结果。然后采用决策级分词融合模型进行分词,决策级分词融合模型为分层的融合结构,包括特征级和决策级,最后采用一种基于Web的方法识别句子中的未登录词。本方法通过采用决策级融合方式进行分词结果融合,有效提高了分词结果的准确性。本发明在信息检索、文本分类、主题检测、网络内容监控等领域具有广阔的应用前景。

Patent Agency Ranking