-
公开(公告)号:CN115759108A
公开(公告)日:2023-03-07
申请号:CN202211273257.5
申请日:2022-10-18
Applicant: 西南大学
IPC: G06F40/30 , G06F40/289 , G06F40/216 , G06F40/194 , G06F16/35 , G06N20/10 , G16H50/20 , G16H50/30
Abstract: 本发明属于关键词生成技术领域,公开了一种关键词生成方法、系统、介质、设备及信息处理终端,依次执行文本预处理模块、词向量训练模块以及语义距离计算模块后,进行客观词汇网络构建,确定心理学语义指标,进而实现关键词生成;文本相似性分析包括文本预处理、词向量训练、语义距离计算及权重分析;文本预处理包括文本分词、词性标记、情绪词分析及词频统计,词向量训练包括参数设置、训练算法及语料库,语义距离计算包括段落/页面、句子、词组及单词,权重分析包括词向量加权和关键词提取。本发明利用文本相似性分析、心理学语义指标分析以及机器学习预测分析等步骤,减少待挖掘文本的标注量,节约人力成本,且提高了关键词抽取的准确率。