-
公开(公告)号:CN108399241B
公开(公告)日:2021-08-31
申请号:CN201810170864.6
申请日:2018-02-28
Applicant: 福州大学
IPC: G06F16/953 , G06F40/284 , G06F40/211 , G06N3/04 , G06Q50/00 , G06K9/62
Abstract: 本发明涉及一种基于多类特征融合的新兴热点话题检测系统,包括:数据预处理模块,用于对微博文本进行预处理;分层序列模型,用于训练双向循环神经网络模型,通过使用双向的LSTM网络,训练输入的微博文本;词序列编码层,用于对句子中的各个词语向量化,形成初步的向量表示;句子级别特征求解层,用于对微博句子构建静态特征向量,与该层的神经网络动态特征进行链接,形成微博句子向量表示;话题级别特征求解层,用于对话题构建静态特征向量,与该层的神经网络动态特征进行链接,形成话题的向量表示;话题预测模块,用于对话题进行预测。本发明基于双向长短时期记忆网络架构,加入相应的动态特征和静态特征,提高新兴热点话题检测能力。
-
公开(公告)号:CN108460019A
公开(公告)日:2018-08-28
申请号:CN201810170148.8
申请日:2018-02-28
Applicant: 福州大学
Abstract: 本发明涉及一种基于注意力机制的新兴热点话题检测系统,包括:数据预处理模块、分层序列模型、词序列编码层、词语级别注意力层、句子级别编码层、句子级别注意力层、话题预测模块。本发明提出的一种基于注意力机制的新兴热点话题检测系统,在双向循环神经网络基础上,加入两层注意力机制来加强话题的向量表示,提出基于注意力机制的分层循环神经网络模型,能够利用社交媒介中数据的各维度作为特征,训练高质量的话题向量特征,从而检测出新兴热点话题,并提高了新兴热点话题检测能力。
-
公开(公告)号:CN108399241A
公开(公告)日:2018-08-14
申请号:CN201810170864.6
申请日:2018-02-28
Applicant: 福州大学
Abstract: 本发明涉及一种基于多类特征融合的新兴热点话题检测系统,包括:数据预处理模块,用于对微博文本进行预处理;分层序列模型,用于训练双向循环神经网络模型,通过使用双向的LSTM网络,训练输入的微博文本;词序列编码层,用于对句子中的各个词语向量化,形成初步的向量表示;句子级别特征求解层,用于对微博句子构建静态特征向量,与该层的神经网络动态特征进行链接,形成微博句子向量表示;话题级别特征求解层,用于对话题构建静态特征向量,与该层的神经网络动态特征进行链接,形成话题的向量表示;话题预测模块,用于对话题进行预测。本发明基于双向长短时期记忆网络架构,加入相应的动态特征和静态特征,提高新兴热点话题检测能力。
-
-