-
公开(公告)号:CN110705277A
公开(公告)日:2020-01-17
申请号:CN201910921615.0
申请日:2019-09-27
Applicant: 哈尔滨理工大学
Inventor: 周雪松 , 赵凌云 , 其他发明人请求不公开姓名
IPC: G06F40/284 , G06F40/30 , G06N3/04 , G06N3/08
Abstract: 本发明涉及一种基于循环神经网络(Recurrent Netural Networks,RNN)的中文词义消歧方法。本发明首先对语料进行预处理。该步骤对训练预料和测试预料包含歧义词汇的语句进行分词和特征标注处理。处理好的训练预料用于训练RNN模型,目的是对模型进行优化。利用优化后的RNN模型,对测试预料进行消歧,可得到歧义词汇在各语义类别下的概率分布向量。在这个向量中,最大值对应的语义类即判别为歧义词汇的语义类。本发明具有较好的词义消歧效果,可以对歧义词汇的含义进行更好的判断。
-
公开(公告)号:CN109214007A
公开(公告)日:2019-01-15
申请号:CN201811091648.9
申请日:2018-09-19
Applicant: 哈尔滨理工大学
Abstract: 本发明涉及一种基于卷积神经网络(Convolutional Neural Network,CNN)的词义消岐方法。本发明首先对汉语语料进行处理,对包含歧义词汇的汉语句子进行分词、词性标注和语义标注处理,得到处理好的训练语料和测试语料;然后利用训练语料对模型进行训练,得到优化后的CNN模型;在优化后的CNN模型上,对测试语料进行消岐,得到歧义词汇在每个语义类别下的概率分布;具有最大概率的语义类别即为歧义词汇的语义类别。本发明对歧义词汇实现了很好的消岐,更准确地判断歧义词汇的真实含义。
-