发明授权
- 专利标题: 一种考虑概念抽象度的浅层分析自动文档综述方法
- 专利标题(英): Superficial layer analyzing and auto document summary method based on abstraction degree of concept
-
申请号: CN200810231990.4申请日: 2008-10-29
-
公开(公告)号: CN101382962B公开(公告)日: 2011-03-02
- 发明人: 郭雷 , 王晓东 , 方俊
- 申请人: 西北工业大学
- 申请人地址: 陕西省西安市友谊西路127号
- 专利权人: 西北工业大学
- 当前专利权人: 南通中邦纺织有限公司,西北工业大学
- 当前专利权人地址: 陕西省西安市友谊西路127号
- 代理机构: 西北工业大学专利中心
- 代理商 王鲜凯
- 主分类号: G06F17/30
- IPC分类号: G06F17/30
摘要:
本发明涉及一种考虑概念抽象度的浅层分析自动文档综述方法,属于信息检索、情报科学领域。其特征在于:首先对于文档进行预处理并设定抽象度值,然后通过多义词消歧处理把文档中的句子用概念矢量模型表示,再将句子聚类成多个主题相似的簇,接着根据从文集中抽取出的主题词个数确定综述的压缩比,之后确定句子的抽象度,继而依据IMMRA值依次从聚类簇中选取压缩比要求数量个文摘句,最后对抽取的文摘句进行排序并输出综述文档。有益效果:实现了考虑抽象度的自动文档综述,降低自动综述文摘因概念包含关系引起的信息冗余或缺失;方法可以根据主题的数量自适应调整文摘的长度,还可以根据用户的抽象度需求调节综述的归纳度,具有很好的适应性。
公开/授权文献
- CN101382962A 一种考虑概念抽象度的浅层分析自动文档综述方法 公开/授权日:2009-03-11