面向电子图书的语义空间表示方法及系统

    公开(公告)号:CN103593339A

    公开(公告)日:2014-02-19

    申请号:CN201310634080.1

    申请日:2013-11-29

    Abstract: 本发明提供了一种面向电子图书的语义空间表示方法及系统,该面向电子图书的语义空间表示方法包括如下步骤:A.文档分割:将电子图书按语义结构分成若干个语义单元;B.权重计算:首先构建全文的词汇表,从而电子图书的每一个语义单元用一个词频向量表示,整个电子图书用一个词频矩阵来表示;然后根据权重计算方法针对每个词计算其权重;C.关系图构建:根据电子图书的词频矩阵和词的权重构建一个词邻接关系图;D.多维压缩:用该低维语义空间模型表示电子图书。本发明的有益效果是本发明的低维空间表示可以更加有效的用于储存、分类、聚类等数据分析与挖掘。

Patent Agency Ranking