-
公开(公告)号:CN112069313A
公开(公告)日:2020-12-11
申请号:CN202010809567.9
申请日:2020-08-12
Applicant: 北京工业大学
IPC: G06F16/35 , G06F40/284 , G06N3/04 , G06N3/08 , G06Q50/00
Abstract: 本发明提供了一种基于BERT和双向LSTM、注意力机制融合的关于灾难信息博文分类方法,用于解决灾难来临时评估社交媒体文本信息重要性的问题,本方法包括训练和分类两大阶段,训练阶段分为以下五步:训练数据预处理;用BERT模型获取训练数据的词向量;用双向LSTM算法对词向量序列进行特征提取;用注意力机制加权获取文本‑标签重要性特征向量;构建前馈神经网络并训练;分类阶段,利用训练完成的网络对待分类文本进行分类;训练阶段中的注意力机制分为两步,其中第二步注意力机制仅用于训练。本方法不同于以往的文本嵌入方式,克服了短文本特征稀缺的问题,明显的提升了分类效果。
-
公开(公告)号:CN111079031B
公开(公告)日:2023-09-12
申请号:CN201911387714.1
申请日:2019-12-27
Applicant: 北京工业大学
IPC: G06F16/9536 , G06F16/35
Abstract: 本发明公开了一种基于深度学习和XGBoost算法的博文关于灾难信息重要性加权分类方法,包括以下步骤:步骤(1)接收社交媒体文本数据并预处理;步骤(2)构建灾难单词预训练词向量表,用于社交媒体文本数据转化为词向量;步骤(3)通过步骤(2)更新后的词向量表,把经过步骤(1)预处理后的社交媒体文本数据转化成维度为d的词向量,并利用XGBoost算法对社交媒体文本数据进行信息类别分类和重要性类别分类;步骤(4)对社交媒体文本数据的信息分类结果和警报性分类结果进行加权确定所含文本信息的重要性。实验结果表明,社交媒体文本数据的信息重要性分类效果有明显提升。
-
公开(公告)号:CN111079031A
公开(公告)日:2020-04-28
申请号:CN201911387714.1
申请日:2019-12-27
Applicant: 北京工业大学
IPC: G06F16/9536 , G06F16/35
Abstract: 本发明公开了一种基于深度学习和XGBoost算法的博文关于灾难信息重要性加权分类方法,本方法主要分为以下五步:步骤(1)接收社交媒体文本数据并预处理;步骤(2)构建灾难单词预训练词向量表,用于社交媒体文本数据转化为词向量;步骤(3)通过步骤(2)更新后的词向量表,把经过步骤(1)预处理后的社交媒体文本数据转化成维度为d的词向量,并利用XGBoost算法对社交媒体文本数据进行信息类别分类和重要性类别分类;步骤(4)对社交媒体文本数据的信息分类结果和警报性分类结果进行加权确定所含文本信息的重要性;本方法在社交媒体文本数据的基础上,加入了重要性加权函数,通过对社交媒体文本数据的信息类别和警报性类别划分,建立信息类别与警报性之间的关联程度,采用了深度学习和XGBoost算法结合进行分类,并且将信息类别和警报性类别关联进行加权,得到最终的社交媒体文本数据信息重要性指标。实验结果表明,社交媒体文本数据的信息重要性分类效果有明显提升。
-
-