-
公开(公告)号:CN100535895C
公开(公告)日:2009-09-02
申请号:CN200410057211.5
申请日:2004-08-23
Applicant: 富士施乐株式会社
Abstract: 本发明提供了一种文本检索装置和方法,其对传统的检索手段进行改良,引入自然语言深层的语义信息进行信息比较及检索。本发明采用将语义信息同向量空间模型相结合的方法,通过赋予语义信息附加的权重来改进向量空间模型的向量特征值,以提高向量特征值同文本语义之间的相关度,实现高精度的信息比较及检索。由于采用向量特征值之间的相似度(距离)来衡量文本之间的相似度,所以其比较及检索速度等同于向量空间模型。
-
公开(公告)号:CN1741012A
公开(公告)日:2006-03-01
申请号:CN200410057211.5
申请日:2004-08-23
Applicant: 富士施乐株式会社
Abstract: 本发明提供了一种文本检索装置和方法,其对传统的检索手段进行改良,引入自然语言深层的语义信息进行信息比较及检索。本发明采用将语义信息同向量空间模型相结合的方法,通过赋予语义信息附加的权重来改进向量空间模型的向量特征值,以提高向量特征值同文本语义之间的相关度,实现高精度的信息比较及检索。由于采用向量特征值之间的相似度(距离)来衡量文本之间的相似度,所以其比较及检索速度等同于向量空间模型。
-