-
公开(公告)号:CN114742066A
公开(公告)日:2022-07-12
申请号:CN202210301411.9
申请日:2022-03-24
Applicant: 燕山大学
IPC: G06F40/30 , G06F40/151 , G06N3/04 , G06N3/08
Abstract: 本发明公开了一种基于RoBERTa模型的情感分析方法及装置,属于自然语言处理技术领域,包括获取文本情感分析数据集并进行预处理,得到训练集、验证集和测试集;提取训练集和验证集的评论文本,转换成无标签数据作为RoBERTa模型预训练任务的语料;构建RoBERTa‑WWM‑ext模型和双向独立循环神经网络并训练,将已完成预训练的RoBERTa‑WWM‑ext模型的最后一层隐藏层外接双向独立循环神经网络,得到情感分析模型,其中,双向独立循环神经网络需要对双向独立循环神经网络输出的特征向量进行权重分配;通过情感分析模型,对测试集进行情感极性预测输出情感类别标签;该方法可以有效提升文本情感分析的精度表现。
-
公开(公告)号:CN114912423A
公开(公告)日:2022-08-16
申请号:CN202210302985.8
申请日:2022-03-24
Applicant: 燕山大学
Abstract: 本发明公开一种基于迁移学习的方面级别情感分析方法及装置,属于自然语言处理技术领域,该方法包括获取方面级别的情感分析数据集并进行预处理,得到包含方面级别评价实体和上下文的样本序列,作为无标签数据;构建RoBERTa模型,使用无标签数据做掩码预测任务训练RoBERTa模型,得到完成此阶段训练任务的RoBERTa模型;获取文档级别情感数据集;对完成掩码预测预训练任务的RoBERTa模型,做文档级别情感分析任务训练此模型;构建融合评论文本信息、方面信息的句子对作为第二样本序列;将第二样本序列输入已完成文档级别情感分析任务的RoBERTa模型,输出情感类别标签,使其可以获得准确率更高的精度表现。
-
公开(公告)号:CN114742066B
公开(公告)日:2024-11-26
申请号:CN202210301411.9
申请日:2022-03-24
Applicant: 燕山大学
IPC: G06F40/30 , G06F40/151 , G06N3/0455 , G06N3/08
Abstract: 本发明公开了一种基于RoBERTa模型的情感分析方法及装置,属于自然语言处理技术领域,包括获取文本情感分析数据集并进行预处理,得到训练集、验证集和测试集;提取训练集和验证集的评论文本,转换成无标签数据作为RoBERTa模型预训练任务的语料;构建RoBERTa‑WWM‑ext模型和双向独立循环神经网络并训练,将已完成预训练的RoBERTa‑WWM‑ext模型的最后一层隐藏层外接双向独立循环神经网络,得到情感分析模型,其中,双向独立循环神经网络需要对双向独立循环神经网络输出的特征向量进行权重分配;通过情感分析模型,对测试集进行情感极性预测输出情感类别标签;该方法可以有效提升文本情感分析的精度表现。
-
公开(公告)号:CN114912423B
公开(公告)日:2024-10-29
申请号:CN202210302985.8
申请日:2022-03-24
Applicant: 燕山大学
IPC: G06F40/169 , G06F40/30 , G06F16/35 , G06F18/214 , G06N3/0442 , G06N3/084 , G06N3/0895 , G06N3/096
Abstract: 本发明公开一种基于迁移学习的方面级别情感分析方法及装置,属于自然语言处理技术领域,该方法包括获取方面级别的情感分析数据集并进行预处理,得到包含方面级别评价实体和上下文的样本序列,作为无标签数据;构建RoBERTa模型,使用无标签数据做掩码预测任务训练RoBERTa模型,得到完成此阶段训练任务的RoBERTa模型;获取文档级别情感数据集;对完成掩码预测预训练任务的RoBERTa模型,做文档级别情感分析任务训练此模型;构建融合评论文本信息、方面信息的句子对作为第二样本序列;将第二样本序列输入已完成文档级别情感分析任务的RoBERTa模型,输出情感类别标签,使其可以获得准确率更高的精度表现。
-
-
-