-
公开(公告)号:CN110083710A
公开(公告)日:2019-08-02
申请号:CN201910365929.7
申请日:2019-04-30
Applicant: 北京工业大学
Abstract: 本发明涉及一种基于循环神经网络与潜变量结构的词语定义生成方法,属于自然语言处理领域。本发明在基于循环神经网络的基础上利用变分自编码器(VAE)对释义进行建模,结合潜变量特征,根据被定义词的上下文信息对词义进行提取来生成词语的释义,具体包括:建立并整理基础语料库;选取被定义词语的近义词集合,扩展基础语料库,形成最终语料库;对被定义词语的词向量进行扩展重构;构建基于循环神经网络与潜变量结构模型;训练基于循环神经网络与潜变量结构模型;将待释义词语及其上下文信息输入训练完成的模型中,实现具体语境中待释义词语的语义释义,解决一词多义问题。
-
公开(公告)号:CN110083710B
公开(公告)日:2021-04-02
申请号:CN201910365929.7
申请日:2019-04-30
Applicant: 北京工业大学
Abstract: 本发明涉及一种基于循环神经网络与潜变量结构的词语定义生成方法,属于自然语言处理领域。本发明在基于循环神经网络的基础上利用变分自编码器(VAE)对释义进行建模,结合潜变量特征,根据被定义词的上下文信息对词义进行提取来生成词语的释义,具体包括:建立并整理基础语料库;选取被定义词语的近义词集合,扩展基础语料库,形成最终语料库;对被定义词语的词向量进行扩展重构;构建基于循环神经网络与潜变量结构模型;训练基于循环神经网络与潜变量结构模型;将待释义词语及其上下文信息输入训练完成的模型中,实现具体语境中待释义词语的语义释义,解决一词多义问题。
-