发明授权
- 专利标题: 基于样本扩充的网络舆情分析方法
-
申请号: CN202111394754.6申请日: 2021-11-23
-
公开(公告)号: CN114091469B公开(公告)日: 2022-08-19
- 发明人: 张蕾 , 吴叶 , 马超杰
- 申请人: 杭州萝卜智能技术有限公司
- 申请人地址: 浙江省杭州市余杭区仓前街道海创科技中心3幢1011-2室
- 专利权人: 杭州萝卜智能技术有限公司
- 当前专利权人: 杭州萝卜智能技术有限公司
- 当前专利权人地址: 浙江省杭州市余杭区仓前街道海创科技中心3幢1011-2室
- 代理机构: 杭州信与义专利代理有限公司
- 代理商 丁浩
- 主分类号: G06F40/30
- IPC分类号: G06F40/30 ; G06F40/216 ; G06F40/242 ; G06F40/247 ; G06F40/289 ; G06F16/35 ; G06K9/62 ; G06N3/04 ; G06N3/08
摘要:
本发明公开了了一种基于样本扩充的网络舆情分析方法,包括步骤:S1,扩充情感极性词典,S2,以四元组形式表达情感极性词典中的每个情感词,并从四元组中提取出模型训练样本,然后基于ALBERT和TextCNN算法训练形成网络舆情倾向性分析模型;S3,将当前舆情信息作为网络舆情倾向性分析模型的输入,模型预测输出当前网络舆情的倾向性。本发明通过扩充情感极性词典,增加了模型训练样本的数据量,解决了样本类型不平衡的问题,通过结合ALBERT和TextCNN算法去训练网络舆情倾向分析模型,克服了单独使用TextCNN算法训练模型存在的不能学习到网络舆情文本更深层次、更全面的信息的缺陷,提升模型了对网络舆情倾向性的预测准确度。
公开/授权文献
- CN114091469A 基于样本扩充的网络舆情分析方法 公开/授权日:2022-02-25