基于深度学习的词句级短文本分类方法

    公开(公告)号:CN110717330A

    公开(公告)日:2020-01-21

    申请号:CN201910901086.8

    申请日:2019-09-23

    Inventor: 杨悦 孟宪禹

    Abstract: 基于深度学习的词句级短文本分类方法,属于自然语言处理技术领域。该方法基于词向量技术将词特征与句特征结合以表现复杂文本特征,通过卷积神经网络多个卷积核对单句句内的词向量进行卷积池化并连接全部特征图获得句向量,再将句向量按时序输入长短期记忆网络进行上下文关联以更好的表达文本内容。将待分类短文本数据经分句、分词、去除停用词并转化词向量等处理后输入词句级卷积循环神经网络进行训练,最终可获得短文本分类模型并完成短文本分类任务。该方法在测试的中文垃圾电子邮件分类与新闻文本分类上均有着较好的表现。

Patent Agency Ranking