发明授权
- 专利标题: 一种面向特定领域的中文事件抽取方法
-
申请号: CN201810426812.0申请日: 2018-05-07
-
公开(公告)号: CN108920447B公开(公告)日: 2022-08-05
- 发明人: 赵忠华 , 李舟军 , 王昌宝 , 孙小宁 , 李欣 , 万欣欣
- 申请人: 国家计算机网络与信息安全管理中心 , 北京航空航天大学
- 申请人地址: 北京市朝阳区裕民路甲3号;
- 专利权人: 国家计算机网络与信息安全管理中心,北京航空航天大学
- 当前专利权人: 国家计算机网络与信息安全管理中心,北京航空航天大学
- 当前专利权人地址: 北京市朝阳区裕民路甲3号;
- 代理机构: 北京慧泉知识产权代理有限公司
- 代理商 王顺荣; 唐爱华
- 主分类号: G06F40/205
- IPC分类号: G06F40/205 ; G06F40/284 ; G06F40/289
摘要:
本发明一种面向特定领域的中文事件抽取方法,包括:预处理:对原始数据信息去除冗余标签、分句、分词;字典构建:人工对大规模新闻语料分析,对特定领域常见角色总结,构建角色字典;对报道特定领域事件的常见句型进行总结,构建基于触发词的句型字典;句法分析:对给定的中文新闻报道语句,进行句法解析得到句法解析树;句型匹配:根据句型字典在句法树上进行句型匹配;事件要素抽取:根据角色字典在句法树上进行角色抽取,根据时间和地点要素的句法特征在句法树上进行时间和地点抽取。本发明解决了大数据环境下快速获取中文新闻资讯信息的难题,通过自动化处理,用户根据自己输入关键词即可得到关键词相关的新闻事件,为信息获取提供极大便利。
公开/授权文献
- CN108920447A 一种面向特定领域的中文事件抽取方法 公开/授权日:2018-11-30