基于聚合加权矩阵压缩算法的文本语义表示方法

    公开(公告)号:CN105718440B

    公开(公告)日:2019-01-29

    申请号:CN201410728902.7

    申请日:2014-12-03

    Applicant: 南开大学

    Abstract: 本发明属于数据挖掘技术领域,具体提出了一种基于聚合加权矩阵压缩算法的文本表示方法。该方法通过构建全局平滑语境矩阵,弱化了语用习惯对单词语义的影响;利用单词向量聚合算法加权全局平滑语境,修正了单词向量权重度量方法;最后使用无穷范数压缩算法将全局平滑语境转化为向量来表征文本。相较于已有方法,由于保留了向量各维度的最大可能取值,因此更全面地表征了文本信息。

    基于聚合加权矩阵压缩算法的文本语义表示方法

    公开(公告)号:CN105718440A

    公开(公告)日:2016-06-29

    申请号:CN201410728902.7

    申请日:2014-12-03

    Applicant: 南开大学

    Abstract: 本发明属于数据挖掘技术领域,具体提出了一种基于聚合加权矩阵压缩算法的文本表示方法。该方法通过构建全局平滑语境矩阵,弱化了语用习惯对单词语义的影响;利用单词向量聚合算法加权全局平滑语境,修正了单词向量权重度量方法;最后使用无穷范数压缩算法将全局平滑语境转化为向量来表征文本。相较于已有方法,由于保留了向量各维度的最大可能取值,因此更全面地表征了文本信息。

Patent Agency Ranking