基于二次解码的军事想定文本事件信息抽取方法及装置
摘要:
本发明提供了一种基于二次解码的军事想定文本事件信息抽取方法及装置,所述方法包括:1、预处理,通过构建专业词典、分句、分词处理,得到词序列形式表示的数据集;2、语料标注,通过定义军事想定文本中9类事件的结构化语义,制定语料标注方法和规则,人工对语料标注,得到训练集和测试集;3、模型训练,利用训练集对机器学习模型编码,得到事件抽取参数;4、信息抽取,输入测试集,运用特定算法进行一次解码,得到事件触发词抽取序列,再基于触发词抽取结果自适应调用不同的事件元素抽取参数进行二次解码,得到事件元素抽取序列。本发明解决了一次解码抽取方法存在的事件触发词与事件元素错误匹配的问题,提高了事件信息抽取的准确度。
0/0