一种基于改进CNN-LDA的情感分析方法

    公开(公告)号:CN109977413A

    公开(公告)日:2019-07-05

    申请号:CN201910248424.2

    申请日:2019-03-29

    Inventor: 张咪 章韵

    Abstract: 本发明公开了一种基于改进CNN‑LDA的情感分析方法,包括:爬虫豆瓣影评数据进行预处理;采用Word2vec获得语料集词向量;利用情感词典添加情感倾向权重;将Word2vec得到的词向量与情感倾向权重向量机获得情感倾向词向量;采用LDA主题生成模型获得语料集主题向量;将情感倾向词向量与主题向量叠加得到语料集的输入表征;将训练集词向量表征输入CNN模型以建立情感分析模型;最后将测试集词向量表征输入已训练网络进行分类评估。本发明提供了一种基于改进CNN‑LDA的情感分析方法,将情感倾向词向量与主题向量相结合,同时考虑了包含文本情感信息的词粒度和文本粒度层面的信息,从而可以在训练过程中更好的利用文本信息,提高文本情感分析的准确度。

    一种网络业务流特征选择与分类方法

    公开(公告)号:CN108494620B

    公开(公告)日:2021-07-27

    申请号:CN201810169202.7

    申请日:2018-02-28

    Inventor: 董育宁 张咪

    Abstract: 本发明公开了一种基于多目标自适应演化算法的业务流特征选择与分类方法,该方法首先利用信息增益率对特征进行排序,滤除部分无关特征,达到快速降维的目的,然后以自适应演化算法对特征空间进行搜索,并用信息增益率排名靠前的特征作为初始种群,以不一致率和特征子集维数两个目标函数作为评价函数选取最优特征子集。自适应交叉和变异保持了种群多样性,且保证了算法的收敛能力。同时本发明利用设计的三层KNN分类器模型对在线标清直播视频、网页浏览(Baidu)、在线音频、网页浏览(sina)、网络语音聊天、在线标清非直播视频六种多媒体业务流进行分类。实验结果表明,该方法比现有方法具有更高的分类准确率。

    一种基于改进CNN-LDA的情感分析方法

    公开(公告)号:CN109977413B

    公开(公告)日:2023-06-06

    申请号:CN201910248424.2

    申请日:2019-03-29

    Inventor: 张咪 章韵

    Abstract: 本发明公开了一种基于改进CNN‑LDA的情感分析方法,包括:爬虫豆瓣影评数据进行预处理;采用Word2vec获得语料集词向量;利用情感词典添加情感倾向权重;将Word2vec得到的词向量与情感倾向权重向量机获得情感倾向词向量;采用LDA主题生成模型获得语料集主题向量;将情感倾向词向量与主题向量叠加得到语料集的输入表征;将训练集词向量表征输入CNN模型以建立情感分析模型;最后将测试集词向量表征输入已训练网络进行分类评估。本发明提供了一种基于改进CNN‑LDA的情感分析方法,将情感倾向词向量与主题向量相结合,同时考虑了包含文本情感信息的词粒度和文本粒度层面的信息,从而可以在训练过程中更好的利用文本信息,提高文本情感分析的准确度。

    基于多目标自适应演化算法的网络业务流特征选择与分类方法

    公开(公告)号:CN108494620A

    公开(公告)日:2018-09-04

    申请号:CN201810169202.7

    申请日:2018-02-28

    Inventor: 董育宁 张咪

    Abstract: 本发明公开了一种基于多目标自适应演化算法的网络业务流特征选择与分类方法,该方法首先利用信息增益率对特征进行排序,滤除部分无关特征,达到快速降维的目的,然后以自适应演化算法对特征空间进行搜索,并用信息增益率排名靠前的特征作为初始种群,以不一致率和特征子集维数两个目标函数作为评价函数选取最优特征子集。自适应交叉和变异保持了种群多样性,且保证了算法的收敛能力。同时本发明利用设计的三层KNN分类器模型对在线标清直播视频、网页浏览(Baidu)、在线音频、网页浏览(sina)、网络语音聊天、在线标清非直播视频六种多媒体业务流进行分类。实验结果表明,该方法比现有方法具有更高的分类准确率。

Patent Agency Ranking