-
公开(公告)号:CN111090994A
公开(公告)日:2020-05-01
申请号:CN201911101388.3
申请日:2019-11-12
Applicant: 北京信息科技大学
IPC: G06F40/284 , G06F40/247 , G06F16/332 , G06F16/35 , G06F16/36
Abstract: 本发明涉及一种面向中文网络论坛文本的事件地点归属省份识别方法,步骤一、文本分词:1、构建地名归属省份查询词典;2、基于jieba工具的中文分词;步骤二、事件地点识别:1、特征值的提取与构建;2、文本事件地点识别;3、多个事件地点去重;步骤三、归属省份确定:针对识别的论坛中帖子文本的事件地点,直接利用地名归属省份查询词典,查询确定论坛中帖子文本的事件地点归属省份。本发明在应对复杂文本分词,尤其是在事件地点识别的基础上对多个事件地点去重以及事件地点归属省份识别等方面给出了明确的思路。本发明实现简单,易于泛化,相较传统的地名识别在精细度和准确度上有了显著提高。