一种基于Zolu函数的词嵌入学习模型及训练方法

    公开(公告)号:CN107273352B

    公开(公告)日:2020-07-14

    申请号:CN201710421488.9

    申请日:2017-06-07

    Abstract: 一种基于Zolu函数的词嵌入学习模型及训练方法,属于自然语言处理、词嵌入、词相似度计算以及词表达准确度技术领域。包括如下步骤:步骤1)接收及配置各种参数;步骤2)建立基于Zolu函数的激活函数表;步骤3)构建词汇表;步骤4)初始化各词向量;步骤5)构建霍夫曼二叉树,并根据词频给每个词设定在二叉树的位置;步骤6)根据词频建立负采样映射表;步骤7)对步骤3)词向量用基于Zolu函数的不同学习模型进行词嵌入训练;步骤8)判断进行聚类与否操作保存训练结果。本发明所提的学习模型与Mikolov所提的CBOW和SG模型以及与LL‑CBOW和LL‑SG算法相比,在词准确度及相似度方面均有所提高。

    一种基于Zolu函数的词嵌入学习模型及训练方法

    公开(公告)号:CN107273352A

    公开(公告)日:2017-10-20

    申请号:CN201710421488.9

    申请日:2017-06-07

    Abstract: 一种基于Zolu函数的词嵌入学习模型及训练方法,属于自然语言处理、词嵌入、词相似度计算以及词表达准确度技术领域。包括如下步骤:步骤1)接收及配置各种参数;步骤2)建立基于Zolu函数的激活函数表;步骤3)构建词汇表;步骤4)初始化各词向量;步骤5)构建霍夫曼二叉树,并根据词频给每个词设定在二叉树的位置;步骤6)根据词频建立负采样映射表;步骤7)对步骤3)词向量用基于Zolu函数的不同学习模型进行词嵌入训练;步骤8)判断进行聚类与否操作保存训练结果。本发明所提的学习模型与Mikolov所提的CBOW和SG模型以及与LL-CBOW和LL-SG算法相比,在词准确度及相似度方面均有所提高。

Patent Agency Ranking