-
公开(公告)号:CN117708336A
公开(公告)日:2024-03-15
申请号:CN202410160917.1
申请日:2024-02-05
Applicant: 南京邮电大学
IPC: G06F16/35 , G06F40/205 , G06F40/30 , G06F18/2415 , G06F18/2431 , G06F18/27 , G06N3/0455 , G06N3/0495 , G06N3/096 , G06N5/045
Abstract: 本发明属于情感分析技术领域,涉及一种基于主题增强和知识蒸馏的多策略情感分析方法;包括对数据集进行预处理获得真实文本;将真实文本中句子使用词袋模型表示成句子词袋表示并作为主题模型的输入,生成主题嵌入表示;将真实文本作为BERT‑base模型的输入获得句子向量表示,通过12层编码器生成12维包含语义信息的特征向量,将主题嵌入表示与特征向量结合,得到包含语义信息和主题信息的句子向量,完成教师模型训练;通过三种蒸馏策略及分类目标损失,对学生模型进行训练,将待分析的数据集输入训练好的学生模型中,得到分类结果;相比现有的情感分析模型,本发明具有更高的分类准确性和模型可解释性,降低模型时延,压缩网络参数。
-
公开(公告)号:CN117708336B
公开(公告)日:2024-04-19
申请号:CN202410160917.1
申请日:2024-02-05
Applicant: 南京邮电大学
IPC: G06F16/35 , G06F40/205 , G06F40/30 , G06F18/2415 , G06F18/2431 , G06F18/27 , G06N3/0455 , G06N3/0495 , G06N3/096 , G06N5/045
Abstract: 本发明属于情感分析技术领域,涉及一种基于主题增强和知识蒸馏的多策略情感分析方法;包括对数据集进行预处理获得真实文本;将真实文本中句子使用词袋模型表示成句子词袋表示并作为主题模型的输入,生成主题嵌入表示;将真实文本作为BERT‑base模型的输入获得句子向量表示,通过12层编码器生成12维包含语义信息的特征向量,将主题嵌入表示与特征向量结合,得到包含语义信息和主题信息的句子向量,完成教师模型训练;通过三种蒸馏策略及分类目标损失,对学生模型进行训练,将待分析的数据集输入训练好的学生模型中,得到分类结果;相比现有的情感分析模型,本发明具有更高的分类准确性和模型可解释性,降低模型时延,压缩网络参数。
-