-
公开(公告)号:CN110489757A
公开(公告)日:2019-11-22
申请号:CN201910789844.1
申请日:2019-08-26
Applicant: 北京邮电大学
IPC: G06F17/27 , G06F16/9535 , G06F16/33 , G06K9/62
Abstract: 本发明实施例提供了一种关键词提取方法及装置,可以获取待处理文本的文本类型对应的目标文本库,基于目标文本库,计算待处理文本的各候选词各自的第一权重,基于候选词图中每两个节点对应的候选词的共现次数,计算各候选词各自的第二权重,基于第一权重和第二权重,从各候选词中确定待处理文本的关键词。基于上述处理,由于目标文本库中包含的文本与待处理文本的文本类型相同,因此,根据目标文本库确定出的第一权重能够有效地体现各候选词是否能够有效地表达待处理文本的主题,另外,基于候选词的共现次数确定出的第二权重,能够体现候选词之间的关联程度,进而,基于结合第一权重和第二权重,确定出的待处理文本的关键词的准确度较高。