- 专利标题: 基于二次解码的军事想定文本事件信息抽取方法及装置
-
申请号: CN201910653282.8申请日: 2019-07-19
-
公开(公告)号: CN110609896B公开(公告)日: 2022-03-22
- 发明人: 刘乾 , 杨若鹏 , 蒋序平 , 卢稳新 , 鲁云军 , 鲁义威 , 战立莹
- 申请人: 中国人民解放军国防科技大学
- 申请人地址: 湖北省武汉市解放公园路45号
- 专利权人: 中国人民解放军国防科技大学
- 当前专利权人: 中国人民解放军国防科技大学
- 当前专利权人地址: 湖北省武汉市解放公园路45号
- 代理机构: 北京兴智翔达知识产权代理有限公司
- 代理商 郭卫芹
- 主分类号: G06F16/35
- IPC分类号: G06F16/35 ; G06F40/289 ; G06F40/216 ; G06F40/242 ; G06N20/20
摘要:
本发明提供了一种基于二次解码的军事想定文本事件信息抽取方法及装置,所述方法包括:1、预处理,通过构建专业词典、分句、分词处理,得到词序列形式表示的数据集;2、语料标注,通过定义军事想定文本中9类事件的结构化语义,制定语料标注方法和规则,人工对语料标注,得到训练集和测试集;3、模型训练,利用训练集对机器学习模型编码,得到事件抽取参数;4、信息抽取,输入测试集,运用特定算法进行一次解码,得到事件触发词抽取序列,再基于触发词抽取结果自适应调用不同的事件元素抽取参数进行二次解码,得到事件元素抽取序列。本发明解决了一次解码抽取方法存在的事件触发词与事件元素错误匹配的问题,提高了事件信息抽取的准确度。
公开/授权文献
- CN110609896A 基于二次解码的军事想定文本事件信息抽取方法及装置 公开/授权日:2019-12-24