-
公开(公告)号:CN113987188A
公开(公告)日:2022-01-28
申请号:CN202111326798.5
申请日:2021-11-10
Applicant: 重庆邮电大学
Abstract: 本发明公开了一种短文本分类方法、装置及电子设备,涉及数据处理技术领域,其技术方案要点是:确定短文本的知识信息与关键词;将短文本、知识信息与关键词嵌入向量空间进行拼接,获得短文本、知识信息与关键词的向量矩阵;采用双向记忆网络层对短文本向量矩阵进行处理获得短文本的语义信息;将短文本的语义信息与知识信息的向量矩阵或关键字的向量矩阵进行注意力计算获得知识信息或关键词的向量;利用卷积神经网络对向量与向量矩阵进行特征提取获得短文本分类结果。本发明解决了现有技术对于短文本分类方法中在面对短文本上下文语义缺失不能准确的进行文本分类问题,提升了文本分类的准确性。
-
公开(公告)号:CN113987188B
公开(公告)日:2022-07-08
申请号:CN202111326798.5
申请日:2021-11-10
Applicant: 重庆邮电大学
IPC: G06F16/35 , G06F40/284 , G06F40/30 , G06N3/04
Abstract: 本发明公开了一种短文本分类方法、装置及电子设备,涉及数据处理技术领域,其技术方案要点是:确定短文本的知识信息与关键词;将短文本、知识信息与关键词嵌入向量空间进行拼接,获得短文本、知识信息与关键词的向量矩阵;采用双向记忆网络层对短文本向量矩阵进行处理获得短文本的语义信息;将短文本的语义信息与知识信息的向量矩阵或关键字的向量矩阵进行注意力计算获得知识信息或关键词的向量;利用卷积神经网络对向量与向量矩阵进行特征提取获得短文本分类结果。本发明解决了现有技术对于短文本分类方法中在面对短文本上下文语义缺失不能准确的进行文本分类问题,提升了文本分类的准确性。
-
公开(公告)号:CN114387118B
公开(公告)日:2024-04-30
申请号:CN202210038530.X
申请日:2022-01-13
Applicant: 重庆邮电大学
IPC: G06Q50/00 , G06F40/279 , G06F40/242 , G06F16/35 , G06F18/214 , G06F18/2411
Abstract: 本发明公开了一种基于粒球计算的人物社交网络主题识别方法及系统,其中方法包括:获取若干人物的社交网络主题标签和所述人物在社交网络的简介信息;对每个所述简介信息进行词嵌入处理,得到若干高维向量表示,每个高维向量表示即一个样本;将所述若干样本作为一个粒球,对所述粒球进行分裂;将分裂得到的所有粒球输入GBSVM分类模型进行训练;将待测人物在社交网络的简介信息作为一个粒球输入训练后的GBSVM分类模型进行预测,得到所述待测人物的社交网络主题标签。本发明将所述粒球分裂成若干个符合质量要求的粒球的过程中,平滑掉了通过自动标注方式获得人物简介信息样本集时产生的噪声数据,提高社交网络主题识别结果的准确性。
-
公开(公告)号:CN114387118A
公开(公告)日:2022-04-22
申请号:CN202210038530.X
申请日:2022-01-13
Applicant: 重庆邮电大学
IPC: G06Q50/00 , G06F40/279 , G06F40/242 , G06F16/35 , G06K9/62
Abstract: 本发明公开了一种基于粒球计算的人物社交网络主题识别方法及系统,其中方法包括:获取若干人物的社交网络主题标签和所述人物在社交网络的简介信息;对每个所述简介信息进行词嵌入处理,得到若干高维向量表示,每个高维向量表示即一个样本;将所述若干样本作为一个粒球,对所述粒球进行分裂;将分裂得到的所有粒球输入GBSVM分类模型进行训练;将待测人物在社交网络的简介信息作为一个粒球输入训练后的GBSVM分类模型进行预测,得到所述待测人物的社交网络主题标签。本发明将所述粒球分裂成若干个符合质量要求的粒球的过程中,平滑掉了通过自动标注方式获得人物简介信息样本集时产生的噪声数据,提高社交网络主题识别结果的准确性。
-
-
-