一种中文关系抽取方法
摘要:
本发明提供一种中文关系抽取方法,包括如下步骤:S1:数据预处理:对输入数据的文本进行多粒度信息的预训练处理,以提取出所述文本中的字、词和词义三个级别的分布式向量;S2:特征编码:以双向长短时记忆网络为基本架构,通过所述字、词和词义三个级别的分布式向量得到字的隐藏状态向量、词的隐藏状态向量,进而得到字级别的最终隐状态向量;S3:关系分类:学习所述字级别的最终隐状态向量,采用所述字级别的注意力机制将所述字级别的隐状态向量融合成一个句子级别的隐状态向量。有效地解决分词歧义和多义词歧义的问题,大大提升了模型在关系抽取任务上的表现,提高中文关系抽取的准确率和鲁棒性。
公开/授权文献
0/0