发明公开
- 专利标题: 关键词抽取方法、装置、电子设备与存储介质
-
申请号: CN202210564852.8申请日: 2022-05-23
-
公开(公告)号: CN114997161A公开(公告)日: 2022-09-02
- 发明人: 洪崴 , 王梓玥 , 王宝鑫 , 伍大勇 , 陈志刚
- 申请人: 河北省讯飞人工智能研究院 , 科大讯飞河北科技有限公司 , 中科讯飞互联(北京)信息科技有限公司
- 申请人地址: 河北省廊坊市经济技术开发区1号路106号新亚研发大厦608-609; ;
- 专利权人: 河北省讯飞人工智能研究院,科大讯飞河北科技有限公司,中科讯飞互联(北京)信息科技有限公司
- 当前专利权人: 河北省讯飞人工智能研究院,科大讯飞河北科技有限公司,中科讯飞互联(北京)信息科技有限公司
- 当前专利权人地址: 河北省廊坊市经济技术开发区1号路106号新亚研发大厦608-609; ;
- 代理机构: 北京路浩知识产权代理有限公司
- 代理商 程琛
- 主分类号: G06F40/289
- IPC分类号: G06F40/289 ; G06F40/268 ; G06F40/30 ; G06N3/04
摘要:
本发明提供一种关键词抽取方法、装置、电子设备与存储介质,其中方法包括:确定待抽取的文本;基于所述文本中各分词的词性,以及所述各分词中至少一个分词的出现频次,对所述至少一个分词进行词组合并,得到所述文本的词组;基于各词组的语义特征进行关键词抽取,得到所述文本中的关键词。本发明提供的方法、装置、电子设备与存储介质,提升了关键词抽取的准确性,同时实现了基于词组粒度的关键词抽取,解决了词粒度关键词语义模糊、泛化等问题,使得提取出的关键词更加完整地保留语义,以便对文本内容的快速理解,有利于后续的推荐和检索。