一种面向特定领域的中文事件抽取方法

    公开(公告)号:CN108920447B

    公开(公告)日:2022-08-05

    申请号:CN201810426812.0

    申请日:2018-05-07

    摘要: 本发明一种面向特定领域的中文事件抽取方法,包括:预处理:对原始数据信息去除冗余标签、分句、分词;字典构建:人工对大规模新闻语料分析,对特定领域常见角色总结,构建角色字典;对报道特定领域事件的常见句型进行总结,构建基于触发词的句型字典;句法分析:对给定的中文新闻报道语句,进行句法解析得到句法解析树;句型匹配:根据句型字典在句法树上进行句型匹配;事件要素抽取:根据角色字典在句法树上进行角色抽取,根据时间和地点要素的句法特征在句法树上进行时间和地点抽取。本发明解决了大数据环境下快速获取中文新闻资讯信息的难题,通过自动化处理,用户根据自己输入关键词即可得到关键词相关的新闻事件,为信息获取提供极大便利。

    舆情分析工作流系统及其方法
    5.
    发明公开

    公开(公告)号:CN115293479A

    公开(公告)日:2022-11-04

    申请号:CN202210559536.1

    申请日:2022-05-23

    IPC分类号: G06Q10/06 G06Q10/10 G06Q50/00

    摘要: 本发明公开了一种舆情分析工作流系统,包括:数据分析功能模块,其包括N个能够进行舆情数据分析的数据分析模块;工作流建立模块,其根据舆情分析需求从数据分析功能模块中选择多个数据分析模块,按顺序进行连接,建立对特定任务进行分析的工作流,针对同一事件不同分析角度的舆情分析需求,建立多个工作流,以对多个舆情分析任务进行分析;工作流管理模块,其对建立的工作流进行数据分析计算,并通过可视化工作流图查看计算结果;事件管理模块,其对同一事件的多个舆情分析任务进行管理,并通过舆情分析数据构建不同任务之间的联系。本发明还提供了舆情分析工作流方法。本系统和方法能够根据舆情分析需求实现从不同层次和不同角度获得舆情信息。

    一种基于网页文本的学者观点抽取方法

    公开(公告)号:CN110263319A

    公开(公告)日:2019-09-20

    申请号:CN201910216192.2

    申请日:2019-03-21

    IPC分类号: G06F17/27 G06F16/35 G06F16/34

    摘要: 本发明涉及一种基于网页文本的学者观点抽取方法,包括学者网页信息采集、文本数据预处理、观点抽取分析、观点摘要生成4个部分;学者信息抽取部分负责从互联网中获取给定学者相关的网页文本数据;文本数据预处理部分负责对原始网页文本数据进行清洗、语句分割、句法树分析、人名识别;观点抽取分析部分负责抽取出观点句,分析观点句的情感倾向和情感极性强度值。观点摘要生成部分负责将同一网页中的学者的所有观点语句进行总结,形成一个观点摘要段落。本发明综合利用了网络信息采集、数据挖掘、情感分析、自然语言处理等技术,从网络中自动提取出学者发表的观点及情感倾向,并生成观点摘要,有了解学者的社会活动和影响有重要意义。