-
公开(公告)号:CN111814453A
公开(公告)日:2020-10-23
申请号:CN202010655517.X
申请日:2020-07-09
Applicant: 重庆大学
IPC: G06F40/216 , G06F40/30 , G06K9/62 , G06N3/04 , G06N3/08
Abstract: 本发明提供了基于BiLSTM-TextCNN的细粒度情感分析方法,步骤如下:S1、输入的数据只以单词向量为目标进行加权,不对词向量求和,从而得到输入层数据Vi;S2、Vi经由BiLSTM产生前向隐向量hli和后向隐向量hri,hli与hri维度相同,将他们在同一维度上拼接可得向量矩阵hi;S3、BiLSTM生成的低层次特征hi,作为TextCNN网络的输入运算,通过卷积和池化后生成特征向量Fi,卷积池化的过程同标准的TextCNN网络;S4、考虑到细粒度分析是多标签分类任务,全连接层这里没有使用Softmax回归,而是使用Sigmoid加以替代。本发明为准确地提取诸如汽车评论等领域数据中的关键信息和关键特征,更有效地提高分类效果,进一步促进深度学习技术在细粒度情感分类上的研究和应用提供了又一理想方法。
-
公开(公告)号:CN109359302B
公开(公告)日:2023-04-18
申请号:CN201811257850.4
申请日:2018-10-26
Applicant: 重庆大学
IPC: G06F40/289 , G06F40/216 , G06F16/383 , G06F16/33 , G06F16/332 , G06N3/045
Abstract: 本发明提供了一种领域化词向量的优化方法及基于其的融合排序方法,其中,领域化词向量的优化方法包括如下步骤:S11、进行无领域词向量的训练并获得需求词向量;S12、进行领域词向量的训练并得到需求词向量后使用RWMD算法进行相似度的计算;S12具体步骤如下:S121、对领域语料库进行数据清洗,将表情符号以及无法识别的乱码进行清除,并对领域语料库本身使用LTP的分词模型进行分词处理;S122、计算每个词语的IDF值,IDF值为每个词语在领域语料库中出现的概率,并计算出IDF_weight的值。领域化词向量的优化方法及基于其的融合排序方法解决现有技术中因不能将无领域词向量和有领域词向量融合而导致新生成的领域化词向量不能适应与某一类特定的垂直领域问答系统的问题。
-
公开(公告)号:CN111814453B
公开(公告)日:2023-08-08
申请号:CN202010655517.X
申请日:2020-07-09
Applicant: 重庆大学
IPC: G06F16/35 , G06F40/30 , G06F40/216 , G06N3/0442 , G06N3/045 , G06N3/0464 , G06N3/047 , G06N3/048 , G06N3/08
Abstract: 本发明提供了基于BiLSTM‑TextCNN的细粒度情感分析方法,步骤如下:S1、输入的数据只以单词向量为目标进行加权,不对词向量求和,从而得到输入层数据Vi;S2、Vi经由BiLSTM产生前向隐向量hli和后向隐向量hri,hli与hri维度相同,将他们在同一维度上拼接可得向量矩阵hi;S3、BiLSTM生成的低层次特征hi,作为TextCNN网络的输入运算,通过卷积和池化后生成特征向量Fi,卷积池化的过程同标准的TextCNN网络;S4、考虑到细粒度分析是多标签分类任务,全连接层这里没有使用Softmax回归,而是使用Sigmoid加以替代。本发明为准确地提取诸如汽车评论等领域数据中的关键信息和关键特征,更有效地提高分类效果,进一步促进深度学习技术在细粒度情感分类上的研究和应用提供了又一理想方法。
-
公开(公告)号:CN109359302A
公开(公告)日:2019-02-19
申请号:CN201811257850.4
申请日:2018-10-26
Applicant: 重庆大学
IPC: G06F17/27 , G06F16/38 , G06F16/332 , G06N3/04
Abstract: 本发明提供了一种领域化词向量的优化方法及基于其的融合排序方法,其中,领域化词向量的优化方法包括如下步骤:S11、进行无领域词向量的训练并获得需求词向量;S12、进行领域词向量的训练并得到需求词向量后使用RWMD算法进行相似度的计算;S12具体步骤如下:S121、对领域语料库进行数据清洗,将表情符号以及无法识别的乱码进行清除,并对领域语料库本身使用LTP的分词模型进行分词处理;S122、计算每个词语的IDF值,IDF值为每个词语在领域语料库中出现的概率,并计算出IDF_weight的值。领域化词向量的优化方法及基于其的融合排序方法解决现有技术中因不能将无领域词向量和有领域词向量融合而导致新生成的领域化词向量不能适应与某一类特定的垂直领域问答系统的问题。
-
-
-