-
公开(公告)号:CN112732872A
公开(公告)日:2021-04-30
申请号:CN202110038330.X
申请日:2021-01-12
Applicant: 东南大学
IPC: G06F16/33 , G06F16/35 , G06F40/216 , G06F40/284 , G06F40/289 , G06K9/62 , G06N3/04 , G06N3/08
Abstract: 本发明公开了面向生物医学文本的基于主题注意机制的多标签分类方法,包括:生物医学文本预处理;对预处理后的文本构建词向量特征;构建词/句子级的层次注意力机制获得生物医学文档的层次注意力表示;利用词袋模型对文档进行表示;利用神经主题模型获得语料库的词分布和文档主题分布;构建主题注意机制获得文档的主题注意力表示;将两种表示连接后通过神经模型进行多标签分类;在训练集中训练神经网络模型,保存最优模型参数;使用最优模型在测试集上测试,得到样本的多个标签。本发明采用了基于门控循环单元的层次注意力机制和主题注意力机制来进行多标签分类任务,相比以往的多标签文本分类方法,本发明具有更好的分类效果。
-
公开(公告)号:CN111339440A
公开(公告)日:2020-06-26
申请号:CN202010102690.7
申请日:2020-02-19
Applicant: 东南大学
IPC: G06F16/9536 , G06F40/211 , G06N3/04
Abstract: 本发明公开了一种面向新闻文本基于层级状态神经网络的社会情绪排序方法,关注文档的语义层次结构信息,处理社会情绪检测中的相关情绪排序问题。本方法包括:对新闻文本进行预处理;通过句子状态循环神经网络,对词编码得到句子表示;通过文档状态循环神经网络,对句子编码得到文档表示;以文档表示为基础,使用多层感知机进行映射,softmax进行归一化处理,得到相关情绪的排序结果。本方法相比之前的相关情绪排序方法,在每个时间步同时对所有词或句子的隐藏状态进行编码,可以更好地捕获长距离语义依赖。此外,采用层级结构机制来捕获文档中关键的层级语义结构,动态突出了文档中唤起情绪的重要部分,可以提升相关情绪排序的性能。
-
公开(公告)号:CN110059160A
公开(公告)日:2019-07-26
申请号:CN201910306552.8
申请日:2019-04-17
Applicant: 东南大学
IPC: G06F16/33 , G06F16/332 , G06N3/04
Abstract: 本发明公开了一种端到端的基于上下文的知识库问答方法及装置,考虑了知识库中实体和关系的连接关系,使得其包含的实体链接和关系预测两个任务相互促进,共同提升。方法主要包括:对问题进行预处理,去除特殊符号;基于知识库构建与问题相关的候选实体集合,并根据候选实体在知识库中相关联的关系构建候选关系集合;对于每个候选集合中的每个实体,抽取实体在问题中的上下文;对候选关系进行不同粒度的划分;基于CERM模型预测主语实体和谓语关系;利用预测的主语实体和关系在知识库中找到宾语实体作为答案返回。本发明将知识库问答中的实体链接与关系预测融入一个统一的预测模型中,实现了主语实体和关系的联合预测,提高了问答的准确率。
-
公开(公告)号:CN105389354B
公开(公告)日:2018-08-21
申请号:CN201510733879.5
申请日:2015-11-02
Applicant: 东南大学
Abstract: 本发明公开了一种面向社交媒体文本的基于EECB模型的无监督的事件抽取和分类方法,包括:社交媒体文本过滤;对过滤后的文本进行预处理;按照时间标记对文本进行分组;基于EECB模型确定各组中每条文本对应的事件;对各组中事件编号相同的事件元素进行后处理;事件合并;将每个事件的每个命名实体映射到语义类,基于EECB模型确定每个事件的事件类型。本发明方法相比面向新闻文本的方法可以获得社交网络中人们关注的事件信息,该方法相比面向社交媒体文本的有监督的方法更具有领域的普适性。并且本发明与现有的TwiCal系统相比,事件抽取及分类的准确率都更高。
-
公开(公告)号:CN105389354A
公开(公告)日:2016-03-09
申请号:CN201510733879.5
申请日:2015-11-02
Applicant: 东南大学
CPC classification number: G06F17/30896 , G06Q50/01
Abstract: 本发明公开了一种面向社交媒体文本的基于EECB模型的无监督的事件抽取和分类方法,包括:社交媒体文本过滤;对过滤后的文本进行预处理;按照时间标记对文本进行分组;基于EECB模型确定各组中每条文本对应的事件;对各组中事件编号相同的事件元素进行后处理;事件合并;将每个事件的每个命名实体映射到语义类,基于EECB模型确定每个事件的事件类型。本发明方法相比面向新闻文本的方法可以获得社交网络中人们关注的事件信息,该方法相比面向社交媒体文本的有监督的方法更具有领域的普适性。并且本发明与现有的TwiCal系统相比,事件抽取及分类的准确率都更高。
-
-
-
-