-
公开(公告)号:CN107273352B
公开(公告)日:2020-07-14
申请号:CN201710421488.9
申请日:2017-06-07
Applicant: 北京理工大学
IPC: G06F40/242 , G06F16/36 , G06K9/62
Abstract: 一种基于Zolu函数的词嵌入学习模型及训练方法,属于自然语言处理、词嵌入、词相似度计算以及词表达准确度技术领域。包括如下步骤:步骤1)接收及配置各种参数;步骤2)建立基于Zolu函数的激活函数表;步骤3)构建词汇表;步骤4)初始化各词向量;步骤5)构建霍夫曼二叉树,并根据词频给每个词设定在二叉树的位置;步骤6)根据词频建立负采样映射表;步骤7)对步骤3)词向量用基于Zolu函数的不同学习模型进行词嵌入训练;步骤8)判断进行聚类与否操作保存训练结果。本发明所提的学习模型与Mikolov所提的CBOW和SG模型以及与LL‑CBOW和LL‑SG算法相比,在词准确度及相似度方面均有所提高。
-
公开(公告)号:CN107273352A
公开(公告)日:2017-10-20
申请号:CN201710421488.9
申请日:2017-06-07
Applicant: 北京理工大学
Abstract: 一种基于Zolu函数的词嵌入学习模型及训练方法,属于自然语言处理、词嵌入、词相似度计算以及词表达准确度技术领域。包括如下步骤:步骤1)接收及配置各种参数;步骤2)建立基于Zolu函数的激活函数表;步骤3)构建词汇表;步骤4)初始化各词向量;步骤5)构建霍夫曼二叉树,并根据词频给每个词设定在二叉树的位置;步骤6)根据词频建立负采样映射表;步骤7)对步骤3)词向量用基于Zolu函数的不同学习模型进行词嵌入训练;步骤8)判断进行聚类与否操作保存训练结果。本发明所提的学习模型与Mikolov所提的CBOW和SG模型以及与LL-CBOW和LL-SG算法相比,在词准确度及相似度方面均有所提高。
-