- 专利标题: 一种面向领域的文本信息抽取聚类方法、设备和存储介质
-
申请号: CN201911019149.3申请日: 2019-10-24
-
公开(公告)号: CN111026866A公开(公告)日: 2020-04-17
- 发明人: 白洁 , 孔庆超 , 王婧宜 , 彭鑫 , 罗引 , 王磊
- 申请人: 北京中科闻歌科技股份有限公司
- 申请人地址: 北京市海淀区北四环西路9号楼银谷大厦7层0715室
- 专利权人: 北京中科闻歌科技股份有限公司
- 当前专利权人: 北京中科闻歌科技股份有限公司
- 当前专利权人地址: 北京市海淀区北四环西路9号楼银谷大厦7层0715室
- 代理机构: 北京华夏泰和知识产权代理有限公司
- 代理商 张丽颖
- 主分类号: G06F16/35
- IPC分类号: G06F16/35 ; G06F40/289
摘要:
本发明公开了一种面向领域的文本信息抽取聚类方法、设备和存储介质。该方法包括:获取文本信息集合;所述文本信息集合包括:目标领域内的多个文本信息和目标领域外的多个文本信息;将所述文本信息集合输入预先训练的抽取聚类模型;通过所述抽取聚类模型对所述文本信息集合执行抽取和聚类处理,得到所述目标领域内每个主题对应的代表性信息。本发明将抽取和聚类融合在一起,使得抽取和聚类相互支撑,在抽取聚类过程中,人工干预少且抽取和聚类高效。
公开/授权文献
- CN111026866B 一种面向领域的文本信息抽取聚类方法、设备和存储介质 公开/授权日:2020-10-23