发明授权
- 专利标题: 一种基于上下文的抽象样本信息检索系统
-
申请号: CN201610369833.4申请日: 2016-05-29
-
公开(公告)号: CN106095791B公开(公告)日: 2019-08-09
- 发明人: 吴琳 , 韩广 , 袁鑫攀 , 李亚楠
- 申请人: 长源动力(北京)科技有限公司
- 申请人地址: 北京市海淀区高里掌路1号院2号楼2层201-004
- 专利权人: 长源动力(北京)科技有限公司
- 当前专利权人: 长源动力(北京)科技有限公司
- 当前专利权人地址: 北京市海淀区高里掌路1号院2号楼2层201-004
- 代理机构: 北京恒泰铭睿知识产权代理有限公司
- 代理商 付怀
- 优先权: 201610068972.3 2016.01.31 CN
- 主分类号: G06F16/332
- IPC分类号: G06F16/332 ; G06F16/35 ; G06K9/62
摘要:
本发明提出了一种基于上下文的抽象样本信息检索系统。该系统中抽象样本特征化表示方法利用Word2vector提取词义特征,获得抽象词的词向量;而后,对抽象词的词向量进行“最优适应度划分”的聚类,并根据聚类结果将抽象词替代表示为聚类质心;最后,根据质心及其所代表的抽象词的词频,构成词向量聚类质心频率模型(ST‑IDF),用于特征化表示抽象样本。本发明降低了聚类及适应度计算的执行次数,提高了抽象样本相似性分析的性能,提升了样本分类准确率。
公开/授权文献
- CN106095791A 一种基于上下文的抽象样本信息检索系统及其抽象样本特征化表示方法 公开/授权日:2016-11-09