-
公开(公告)号:CN117390131B
公开(公告)日:2024-09-24
申请号:CN202310815104.7
申请日:2023-07-04
Applicant: 无锡学院
IPC: G06F16/33 , G06F16/35 , G06F40/289 , G06F40/30 , G06F18/24 , G06F18/23213 , G06N3/0455 , G06N3/048 , G06N3/08
Abstract: 本发明公开了一种用于多领域的文本情感分类方法,包括:获取目标领域带标签的文本数据并进行预处理,对词嵌入层进行训练,在ALBERT模型中嵌入用于文本主题信息提取的LDA模型,在LDA模型中融合K‑means聚类算法;将词向量序列输入至LDA模型中进行无监督训练,提取文本主题信息,得到“文档‑主题”分布的主题特征向量;将主题特征向量输入到K‑means聚类算法进行二次聚类后,使用余弦相似度输出最优的主题特征向量;通过吉布斯采样方法迭代抽样,LDA模型收敛后得到“主题‑词”分布和“评论‑主题”分布;对文本情感分类模型训练,将通过训练后的文本情感分类模型计算情感分类标签的情感概率,将情感概率最大的标签作为目标数据标签,从而实现跨领域的文本情感分类。
-
公开(公告)号:CN117390131A
公开(公告)日:2024-01-12
申请号:CN202310815104.7
申请日:2023-07-04
Applicant: 无锡学院
IPC: G06F16/33 , G06F16/35 , G06F40/289 , G06F40/30 , G06F18/24 , G06F18/23213 , G06N3/0455 , G06N3/048 , G06N3/08
Abstract: 本发明公开了一种用于多领域的文本情感分类方法,包括:获取目标领域带标签的文本数据并进行预处理,对词嵌入层进行训练,在ALBERT模型中嵌入用于文本主题信息提取的LDA模型,在LDA模型中融合K‑means聚类算法;将词向量序列输入至LDA模型中进行无监督训练,提取文本主题信息,得到“文档‑主题”分布的主题特征向量;将主题特征向量输入到K‑means聚类算法进行二次聚类后,使用余弦相似度输出最优的主题特征向量;通过吉布斯采样方法迭代抽样,LDA模型收敛后得到“主题‑词”分布和“评论‑主题”分布;对文本情感分类模型训练,将通过训练后的文本情感分类模型计算情感分类标签的情感概率,将情感概率最大的标签作为目标数据标签,从而实现跨领域的文本情感分类。
-