-
公开(公告)号:CN112507115B
公开(公告)日:2023-02-03
申请号:CN202011418248.1
申请日:2020-12-07
Applicant: 重庆邮电大学
IPC: G06F16/35 , G06F40/242 , G06F40/289
Abstract: 本发明公开了一种弹幕文本中情感词的分类方法及装置,包括以下步骤:对Python爬取到的弹幕数据进行预处理,判断待分类弹幕数据中是否包含情感词,若不包含则直接利用GRU分类器进行分类得到分类结果;若包含情感词,则构造弹幕文本领域的多维弹幕情感词典,并在所述多维弹幕情感词典基础上,构造文本情感计算分类器;采用模型融合的集成学习策略构造弹幕情感分类模型;将测试集数据输入到弹幕情感分类模型中,得到弹幕的情感分类结果。本发明扩展了情感词典,利用GRU、朴素贝叶斯和七维情感计算分类方法作为基分类器,根据各个基分类器得到的结果进行投票融合输出最终情感分类结果,解决弹幕短文本情感词分类问题。
-
公开(公告)号:CN112507164A
公开(公告)日:2021-03-16
申请号:CN202011417368.X
申请日:2020-12-07
Applicant: 重庆邮电大学
IPC: G06F16/735 , G06F16/75 , G06F16/783 , G06F16/951 , G06F40/258 , G06F40/284 , G06F40/30 , G06K9/62
Abstract: 本发明公开了一种基于内容和用户标识的弹幕过滤方法及装置,所述方法包括:对python爬虫软件爬取到的弹幕视频网站弹幕数据和用户数据进行预处理;引入词嵌入、词相似度、词与主题概率度、标签主题概率度共同作用下的短文本表示方法对弹幕短文本进行扩展;构造用户平台类特征;拼接扩展后的文本特征和平台类特征输入分类模型,输出弹幕分类结果。本发明结合外部语料库扩展和短文本自身内容特征扩展的优点,同时将词向量引入特征扩展,最大程度实现原文本语义扩展,在弹幕特征空间中加入用户平台类特征,丰富弹幕特征空间,提高弹幕识别率。
-
公开(公告)号:CN110766311A
公开(公告)日:2020-02-07
申请号:CN201910996287.0
申请日:2019-10-18
Applicant: 重庆邮电大学
Abstract: 本发明属于涉及复杂系统突现计算、微博影响力评价领域,特别涉及一种基于Swarm模型的微博用户影响力计算方法及系统。所述方法包括从微博平台上获取各个微博用户的微博评论、微博转发以及微博点赞;建立大规模群体系统Swarm模型,将微博用户作为Swarm模型的agent主体;对Swarm模型中瞬时加速的向量计算公式进行改进,计算出微博用户在t时刻的影响力;采用累加的方式,计算出微博用户在T时段内最终的影响力。本发明采用Swarm模型对微博用户影响力进行评估,能够对微博话题数据中用户影响力进行评价,可以有效地发现微博话题中影响等级较大的用户,对微博话题舆情的引导及预警有重要意义。
-
公开(公告)号:CN112507115A
公开(公告)日:2021-03-16
申请号:CN202011418248.1
申请日:2020-12-07
Applicant: 重庆邮电大学
IPC: G06F16/35 , G06F40/242 , G06F40/289
Abstract: 本发明公开了一种弹幕文本中情感词的分类方法及装置,包括以下步骤:对Python爬取到的弹幕数据进行预处理,判断待分类弹幕数据中是否包含情感词,若不包含则直接利用GRU分类器进行分类得到分类结果;若包含情感词,则构造弹幕文本领域的多维弹幕情感词典,并在所述多维弹幕情感词典基础上,构造文本情感计算分类器;采用模型融合的集成学习策略构造弹幕情感分类模型;将测试集数据输入到弹幕情感分类模型中,得到弹幕的情感分类结果。本发明扩展了情感词典,利用GRU、朴素贝叶斯和七维情感计算分类方法作为基分类器,根据各个基分类器得到的结果进行投票融合输出最终情感分类结果,解决弹幕短文本情感词分类问题。
-
公开(公告)号:CN112507164B
公开(公告)日:2022-04-12
申请号:CN202011417368.X
申请日:2020-12-07
Applicant: 重庆邮电大学
IPC: G06F16/735 , G06F16/75 , G06F16/783 , G06F16/951 , G06F40/258 , G06F40/284 , G06F40/30 , G06K9/62
Abstract: 本发明公开了一种基于内容和用户标识的弹幕过滤方法及装置,所述方法包括:对python爬虫软件爬取到的弹幕视频网站弹幕数据和用户数据进行预处理;引入词嵌入、词相似度、词与主题概率度、标签主题概率度共同作用下的短文本表示方法对弹幕短文本进行扩展;构造用户平台类特征;拼接扩展后的文本特征和平台类特征输入分类模型,输出弹幕分类结果。本发明结合外部语料库扩展和短文本自身内容特征扩展的优点,同时将词向量引入特征扩展,最大程度实现原文本语义扩展,在弹幕特征空间中加入用户平台类特征,丰富弹幕特征空间,提高弹幕识别率。
-
-
-
-