-
公开(公告)号:CN100535895C
公开(公告)日:2009-09-02
申请号:CN200410057211.5
申请日:2004-08-23
Applicant: 富士施乐株式会社
Abstract: 本发明提供了一种文本检索装置和方法,其对传统的检索手段进行改良,引入自然语言深层的语义信息进行信息比较及检索。本发明采用将语义信息同向量空间模型相结合的方法,通过赋予语义信息附加的权重来改进向量空间模型的向量特征值,以提高向量特征值同文本语义之间的相关度,实现高精度的信息比较及检索。由于采用向量特征值之间的相似度(距离)来衡量文本之间的相似度,所以其比较及检索速度等同于向量空间模型。
-
公开(公告)号:CN100444194C
公开(公告)日:2008-12-17
申请号:CN200510116866.X
申请日:2005-10-27
Applicant: 富士施乐株式会社
IPC: G06K9/20
Abstract: 本发明提供一种自动且高精度地抽取文章标题的标题抽取装置。文章标题抽取装置包括:从由文章输入部(30)输入的文本文章中抽取多个标题候选句的标题候选句抽取部(32);抽取所抽取出的多个标题候选句的各自的特征量的候选句标题判定用特征量抽取部(34);根据所抽取的特征量从多个标题候选句中判定标题的标题判定部(36);输出抽取结果的输出部(38)。特征量至少包含作为标题候选句与文章中的多个句子的相似度的函数值的相似度信息。
-
公开(公告)号:CN1955979A
公开(公告)日:2007-05-02
申请号:CN200510116866.X
申请日:2005-10-27
Applicant: 富士施乐株式会社
IPC: G06K9/20
Abstract: 本发明提供一种自动且高精度地抽取文章标题的标题抽取装置。文章标题抽取装置包括:从由文章输入部(30)输入的文本文章中抽取多个标题候选句的标题候选句抽取部(32);抽取所抽取出的多个标题候选句的各自的特征量的候选句标题判定用特征量抽取部(34);根据所抽取的特征量从多个标题候选句中判定标题的标题判定部(36);输出抽取结果的输出部(38)。特征量至少包含作为标题候选句与文章中的多个句子的相似度的函数值的相似度信息。
-
公开(公告)号:CN1741012A
公开(公告)日:2006-03-01
申请号:CN200410057211.5
申请日:2004-08-23
Applicant: 富士施乐株式会社
Abstract: 本发明提供了一种文本检索装置和方法,其对传统的检索手段进行改良,引入自然语言深层的语义信息进行信息比较及检索。本发明采用将语义信息同向量空间模型相结合的方法,通过赋予语义信息附加的权重来改进向量空间模型的向量特征值,以提高向量特征值同文本语义之间的相关度,实现高精度的信息比较及检索。由于采用向量特征值之间的相似度(距离)来衡量文本之间的相似度,所以其比较及检索速度等同于向量空间模型。
-
-
-