结合用户情感表达方式的中文情感新词识别方法和系统

    公开(公告)号:CN105786991B

    公开(公告)日:2019-03-15

    申请号:CN201610089962.8

    申请日:2016-02-18

    Abstract: 本发明公开了一种结合用户情感表达方式的中文情感新词识别方法和系统。其中,该方法包括获取输入文本;基于所述输入文本中词频大于第一预设阈值的字符串,构建候选新词集合;使用中文旧词词库对所述候选新词集合进行过滤;基于统计指标从过滤的候选新词集合中筛选新词,构建新词集合;其中,所述统计指标为构词能力、点互信息、灵活度和邻接熵;基于情感倾向点互信息,从所述新词集合中识别情感新词,构建初始情感新词集合;基于所述输入文本中涉及的用户的情感表达方式,从所述初始情感新词集合中筛选高置信度情感新词,并将其作为所识别的中文情感新词。通过本发明实施例解决了如何提高情感新词识别的精度和灵活度的技术问题。

    一种基于热点事件的舆情知识图谱构建方法

    公开(公告)号:CN107633044A

    公开(公告)日:2018-01-26

    申请号:CN201710827984.4

    申请日:2017-09-14

    Abstract: 本发明公开了一种基于热点事件的舆情知识图谱构建方法,属于自然语言处理领域;首先实时获取微博文本,对每个微博文本进行处理,构建文本簇,计算每个文本簇所属的话题类别,按类别识别每个簇中的热点事件,统计每个热点事件的多维属性;识别参与热点事件讨论的重要人物和机构,并获取重要人物和机构的多维属性;最后构建事件、人物、机构的多维属性体系及关系类型,以事件、人物、机构为实体,事件、人物、机构之间的关系为关联,构建舆情知识图谱。本发明能够从多个维度对热点事件、人物、机构进行刻画,实现对热点事件、人物、机构的全方位解析;并根据实际需求,设置不同话题类别的权重,实现不同话题的舆情知识图谱构建。

    一种基于微博文本的人物性格刻画方法

    公开(公告)号:CN106202047A

    公开(公告)日:2016-12-07

    申请号:CN201610559542.1

    申请日:2016-07-15

    Abstract: 本发明公开了一种基于微博文本的人物性格刻画方法,属于数据挖掘领域;具体包括:首先,针对某个用户,对该用户某段时间内发的每条微博文本标注情绪标签,统计该用户每天冲动类以及抑郁类情绪的主导天数,从情绪特征角度对用户进行标记;然后,对该用户的所有微博文本进行关注话题分类,并选择该用户的关注话题;判断该用户的关注话题是否包括政治类和民生类,如果有,利用批判性词典对该用户进行语言特征刻画;否则,不做任何处理;最后、融合该用户的情绪特征和语言特征刻画该用户的性格,得到性格标签。优点在于:适用于对微博中人物性格特征刻画和分析,在舆情监控、人物属性刻画和信息传播扩散等领域有重要的应用价值。

    一种基于行为预测控制的可信网络群体构建方法

    公开(公告)号:CN105022964B

    公开(公告)日:2018-03-09

    申请号:CN201510292056.3

    申请日:2015-06-01

    Abstract: 本发明公开了一种基于行为预测控制的可信网络群体构建方法,包括:步骤10,对用户终端进行身份度量;不能通过身份度量的用户终端拒绝接入;步骤20,对通过身份度量的用户终端进行状态度量;不能通过状态度量的用户终端拒绝接入;步骤30,对通过状态度量的用户终端进行行为度量;不能通过行为度量的用户终端拒绝接入。本发明在可信群体的构建过程首先通过预测个体行为是否可信来评估行为个体是否可信,然后在个体行为的基础之上抽象出群体的可信行为的规范,基于群体可信行为的规范来约束个体,使得个体和群体有机结合,最终确保个体和群体的可信,最终通过可信个体来构建一个可信群体。

    一种基于热点事件的舆情知识图谱构建方法

    公开(公告)号:CN107633044B

    公开(公告)日:2021-08-06

    申请号:CN201710827984.4

    申请日:2017-09-14

    Abstract: 本发明公开了一种基于热点事件的舆情知识图谱构建方法,属于自然语言处理领域;首先实时获取微博文本,对每个微博文本进行处理,构建文本簇,计算每个文本簇所属的话题类别,按类别识别每个簇中的热点事件,统计每个热点事件的多维属性;识别参与热点事件讨论的重要人物和机构,并获取重要人物和机构的多维属性;最后构建事件、人物、机构的多维属性体系及关系类型,以事件、人物、机构为实体,事件、人物、机构之间的关系为关联,构建舆情知识图谱。本发明能够从多个维度对热点事件、人物、机构进行刻画,实现对热点事件、人物、机构的全方位解析;并根据实际需求,设置不同话题类别的权重,实现不同话题的舆情知识图谱构建。

    一种大数据驱动的选举舆情预测方法

    公开(公告)号:CN106227766A

    公开(公告)日:2016-12-14

    申请号:CN201610559551.0

    申请日:2016-07-15

    CPC classification number: G06F16/951

    Abstract: 本发明公开了一种大数据驱动的选举舆情预测方法,属于数据挖掘领域。具体为:首先,根据选举国家或地区的互联网网路使用报告和地区网站排名,挑选出大数据信息源;再对每一类信息源进行分析,构建民意预测指标;然后融合提取出的多源预测指标,形成当前互联网民众支持率;进而收集民调报告,融合报告中各年龄段人群对候选人的支持率,形成线下民调支持率值;考虑选举国家或地区人口结构构成和网民年龄分布,融合候选人互联网支持率值与线下民调支持率值,运用移动平均方法,预测下一时间节点候选人支持率值,预测结果以日频度更新。本发明具有数据源广泛、预测周期短、实时性强等特点,在舆情监控和观点分析等领域有重要的应用价值。

    结合用户情感表达方式的中文情感新词识别方法和系统

    公开(公告)号:CN105786991A

    公开(公告)日:2016-07-20

    申请号:CN201610089962.8

    申请日:2016-02-18

    CPC classification number: G06F17/30731 G06F17/2715

    Abstract: 本发明公开了一种结合用户情感表达方式的中文情感新词识别方法和系统。其中,该方法包括获取输入文本;基于所述输入文本中词频大于第一预设阈值的字符串,构建候选新词集合;使用中文旧词词库对所述候选新词集合进行过滤;基于统计指标从过滤的候选新词集合中筛选新词,构建新词集合;其中,所述统计指标为构词能力、点互信息、灵活度和邻接熵;基于情感倾向点互信息,从所述新词集合中识别情感新词,构建初始情感新词集合;基于所述输入文本中涉及的用户的情感表达方式,从所述初始情感新词集合中筛选高置信度情感新词,并将其作为所识别的中文情感新词。通过本发明实施例解决了如何提高情感新词识别的精度和灵活度的技术问题。

Patent Agency Ranking