-
-
公开(公告)号:CN105740349A
公开(公告)日:2016-07-06
申请号:CN201610049581.7
申请日:2016-01-25
Applicant: 重庆邮电大学
CPC classification number: G06F17/30705 , G06F17/2775 , G06F17/30737 , G06N3/084
Abstract: 本发明请求保护一种结合Doc2vec和卷积神经网络的情感分类方法,该方法将Doc2vec和CNN进行有效的结合。该结合方法对于特征的表示,不但考虑到了词与词之间的语义关系,并且解决了维数灾难,还考虑到了词与词之间的顺序问题。CNN可以通过学习一种深层的非线性的网络结构来弥补浅层特征学习方法的不足,采用分布式表示输入数据的表征,展现了强大的特征学习能力,特征提取和模式分类可以同时进行,CNN模型的稀疏连接和权重共享两个特点可以减少网络的训练参数,使神经网络结构变得更简单,适应性更强。结合Doc2vec和CNN来处理情感分类问题可显著提高情感分类的准确率。
-
公开(公告)号:CN105824922A
公开(公告)日:2016-08-03
申请号:CN201610151146.5
申请日:2016-03-16
Applicant: 重庆邮电大学
IPC: G06F17/30
CPC classification number: G06F17/30705 , G06F17/30737
Abstract: 本发明请求保护一种融合深层特征和浅层特征的情感分类方法,选用融合Doc2vec的深层特征和TF?IDF的浅层特征来表示文本的特征,该融合方法不仅解决了Doc2vec中固定词特征表述不清楚的问题,而且也解决了TF?IDF方法没有考虑到词语之间语义的问题,使得文本向量对于文本的表示更加清楚。选用SVM分类方法,分类器的分类性能较好。结合上述方法处理情感分类问题可显著提高情感分类的准确率。
-
公开(公告)号:CN105389379A
公开(公告)日:2016-03-09
申请号:CN201510809492.3
申请日:2015-11-20
Applicant: 重庆邮电大学
IPC: G06F17/30
CPC classification number: G06F17/30705
Abstract: 本发明提出一种基于文本分布式特征表示的垃圾稿件分类方法,该方法采用基于词典和统计策略的中文分词算法对稿件文本进行分词处理,利用word2vec中基于Negative-Sampling算法的Skip-Gram模型,选取线性核的支持向量机,对稿件的文本向量进行训练,得到SVM的稿件分类模型,明显提高了稿件类别判别的正确率,使稿件类别判别的精确度得到较大改善与提高。
-
公开(公告)号:CN105320961A
公开(公告)日:2016-02-10
申请号:CN201510677824.7
申请日:2015-10-16
Applicant: 重庆邮电大学
IPC: G06K9/62
CPC classification number: G06K9/6269
Abstract: 本发明请求保护一种基于卷积神经网络和支持向量机的手写数字识别方法,该方法将卷积神经网络模型和支持向量机模型进行有机结合。结合卷积神经网络和支持向量机的手写数字识别模型能深度地描述样本数据和期望数据的相关性,能从原始的数据中自动地学习图像特征,具有很好的决策平面,对数字模式分类的区分能力很强。本发明简单且易于实现,手写数字识别效果很好。
-
公开(公告)号:CN105824922B
公开(公告)日:2019-03-08
申请号:CN201610151146.5
申请日:2016-03-16
Applicant: 重庆邮电大学
IPC: G06F16/35
Abstract: 本发明请求保护一种融合深层特征和浅层特征的情感分类方法,选用融合Doc2vec的深层特征和TF‑IDF的浅层特征来表示文本的特征,该融合方法不仅解决了Doc2vec中固定词特征表述不清楚的问题,而且也解决了TF‑IDF方法没有考虑到词语之间语义的问题,使得文本向量对于文本的表示更加清楚。选用SVM分类方法,分类器的分类性能较好。结合上述方法处理情感分类问题可显著提高情感分类的准确率。
-
公开(公告)号:CN104933183A
公开(公告)日:2015-09-23
申请号:CN201510385259.7
申请日:2015-07-03
Applicant: 重庆邮电大学
IPC: G06F17/30
CPC classification number: G06F17/30421 , G06F17/30424
Abstract: 本发明提出一种融合词向量模型和朴素贝叶斯查询改写方法,涉及信息处理技术,该方法利用word2vec训练出向量模型并计算出与查询词最相似的前N个词构成初步的相关词库,然后进行相关度计算和分析得到对查询改写词库的候选词进行过滤,保留相关度高的词语,这种方法可有效提高查询结果的准确度和召回度,有效的解决了搜索查询无结果或者返回有效结果少的难题。
-
公开(公告)号:CN105740349B
公开(公告)日:2019-03-08
申请号:CN201610049581.7
申请日:2016-01-25
Applicant: 重庆邮电大学
Abstract: 本发明请求保护一种结合Doc2vec和卷积神经网络的情感分类方法,该方法将Doc2vec和CNN进行有效的结合。该结合方法对于特征的表示,不但考虑到了词与词之间的语义关系,并且解决了维数灾难,还考虑到了词与词之间的顺序问题。CNN可以通过学习一种深层的非线性的网络结构来弥补浅层特征学习方法的不足,采用分布式表示输入数据的表征,展现了强大的特征学习能力,特征提取和模式分类可以同时进行,CNN模型的稀疏连接和权重共享两个特点可以减少网络的训练参数,使神经网络结构变得更简单,适应性更强。结合Doc2vec和CNN来处理情感分类问题可显著提高情感分类的准确率。
-
公开(公告)号:CN105389379B
公开(公告)日:2018-12-04
申请号:CN201510809492.3
申请日:2015-11-20
Applicant: 重庆邮电大学
IPC: G06F17/30
Abstract: 本发明提出一种基于文本分布式特征表示的垃圾稿件分类方法,该方法采用基于词典和统计策略的中文分词算法对稿件文本进行分词处理,利用word2vec中基于Negative‑Sampling算法的Skip‑Gram模型,选取线性核的支持向量机,对稿件的文本向量进行训练,得到SVM的稿件分类模型,明显提高了稿件类别判别的正确率,使稿件类别判别的精确度得到较大改善与提高。
-
-
-
-
-
-
-
-