基于社交网络的用户群体消息传播异常分析方法及装置

    公开(公告)号:CN109145109A

    公开(公告)日:2019-01-04

    申请号:CN201710464424.7

    申请日:2017-06-19

    CPC classification number: G06Q50/01

    Abstract: 本发明涉及一种基于社交网络的用户群体消息传播异常分析方法和装置,包括:获取在线社交网络中用户群体的历史聊天记录,根据预先设定的时间跨度,获取历史聊天记录在时间跨度内用户群体中所有用户所发布的消息,作为消息集合;对于消息集合,根据预先设定的时间范围统计用户群体在每个时间范围内所发布的消息总数;基于时序相关性的特征提取法,对每个消息总数的特征进行提取,并将提取结果集合为样本集合;根据消息总数并采用聚类算法为样本集合对样本集合进行聚类,生成异常样本;根据异常样本判定其所在的用户群体存在消息传播异常。由此本发明能够应对数据涌发现象,同时算法直观简单,准确率更高,且本发明应用场景广泛。

    基于微博热门事件计算关键节点的方法及装置

    公开(公告)号:CN108733763A

    公开(公告)日:2018-11-02

    申请号:CN201810338555.5

    申请日:2018-04-16

    Abstract: 本发明公开了一种基于微博热门事件计算关键节点的方法,包括:获取历史热门事件的转发数、评论数、点赞数和阅读数,定义热门值,并确定热门临界值;获取历史热门事件的初步关键博主,获取作为初步关键传播时间,建立关键传播时间的计算公式;获取目标事件的转发数、评论数、点赞数和阅读数,若目标事件的热门值达到热门临界值,则计算出目标事件的关键传播时间,获得关键时间点;选取在关键时间点附近发微博的若干博主,获取其中与其它博主关联次数最多的博主,即为目标事件的关键博主。本发明还提供了基于微博热门事件计算关键节点的装置。本发明能够在微博热门事件在不可控地爆发之前,找到推动此事件的关键博主,从而使得事件得以控制。

    基于改进PageRank算法的微博信息传播关键节点识别方法

    公开(公告)号:CN108647247A

    公开(公告)日:2018-10-12

    申请号:CN201810338554.0

    申请日:2018-04-16

    Abstract: 本发明提供了基于改进PageRank算法的微博信息传播关键节点识别方法,步骤包括:1)信息采集;2)确定所述微群内转发次数最高的文本信息;3)获取的文本信息获取使用“@”用户标识的文本信息,该用户为B;4)获取的文本信息计算高频词;5)采集用户B的微博文本信息后与所述高频词比对,确定A微群内的成员的转发次数最高文本信息是否被用户B转发,如确定用户B转发,确定B是否传递给了用户C,从而形成信息的传播路径;6)确定传播路径上的用户所在的微群,从而构建微群关注网络;7)通过WeiboRank算法确定最具影响力的微群。本发明实现微群之间以及群内的中关键节点的发掘,不用建立复杂的数据模型,方便快捷的进行群体发现,具有较高的稳定性。

    一种挖掘微博话题趋势发起人的方法

    公开(公告)号:CN104866561B

    公开(公告)日:2018-09-07

    申请号:CN201510255994.6

    申请日:2015-05-19

    Abstract: 本发明公开了一种挖掘微博话题趋势发起人的方法,属于数据挖掘领域。首先针对某一话题微博,以天为时间粒度,构造微博量随时间变化的趋势图,获取波峰点和波谷点,确定趋势的时间范围,提取微博高频词代表趋势主要内容,以趋势早期参与微博高频词的数量作为该条微博的内容相关度,降序排序后提取趋势制造者。根据趋势变化,以小时为时间粒度,构造趋势时间范围的微博数量变化图,获取斜率最大的时间范围作为增速最大的时间段,并对微博转发量降序排序,确定趋势推动者。本发明利用微博数据平台,具有高效性、鲁棒性和简洁性等优点,适用于对话题微博趋势发起人方面的分析,在社会舆情监控和信息传播分析等领域具有重要的应用价值。

    一种基于特征学习的敏感图像识别方法

    公开(公告)号:CN108460390A

    公开(公告)日:2018-08-28

    申请号:CN201810162586.X

    申请日:2018-02-27

    Abstract: 一种基于特征学习的敏感图像识别方法。首先,提取四种颜色SIFT特征,并采用密集采样和点采样方式将四种颜色SIFT描述子融合在一起。接着,采用高斯混合模型对图像数据建模,并基于该概率产生式模型的对数似然函数的下界导出特征映射,这是特征学习的过程。该特征映射编码了数据的中高层语义特征,是观测变量、高斯混合模型的模型参数和隐变量的函数。最后,将数据集分割成训练集和测试集,利用训练集训练分类器的参数。对于输入的测试图像,送入分类器,输出其标签,完成敏感图像识别。本发明采用融合的颜色SIFT描述子描述图像,基于高斯混合模型学习出编码数据分布信息的特征映射,对于识别敏感图像中所包含的高层语义内容非常有效。

    一种基于自动机的实体关系快速抽取方法

    公开(公告)号:CN105824801B

    公开(公告)日:2018-06-15

    申请号:CN201610150794.9

    申请日:2016-03-16

    Abstract: 本发明提供一种基于自动机的实体关系快速抽取方法,包括以下步骤:步骤1,定制规则文件;步骤2,对规则文件中的各个规则进行文法检查,检测规则文件中的各个规则是否满足文法要求,如果满足,则执行步骤3;步骤3,对通过文法检查的所述规则文件中的各个规则进行语义解释;步骤4,将语义解释后的所述规则文件中的各个规则进行解析编译,完成规则向层叠有限状态自动机的转换,得到有限状态自动机;步骤5,使用所述有限状态自动机,对输入的文本数据进行实体属性以及实体关系的抽取,得到最终的实体属性以及实体关系。优点为:能够保证对开放域文本进行快速的实体关系与实体属性抽取。同时,对于特定领域的实体关系可以定制化的进行抽取。

    基于言语行为理论的用户交互意图识别方法及系统

    公开(公告)号:CN107153672A

    公开(公告)日:2017-09-12

    申请号:CN201710171926.0

    申请日:2017-03-22

    Abstract: 本发明涉及一种基于言语行为理论的用户交互意图识别方法及系统,所述用户交互意图识别方法包括:基于外部知识源构建行为标记语词典;根据所述行为标记语词典,自动标注用户在社交媒体平台上输入的在线文本的意图;利用自动标注语料训练基于特征的分类器对所述在线文本的意图进行分类识别,确定用户的交互意图类别。本发明基于言语行为理论的用户交互意图识别方法通过基于外部知识源构建对应不同意图类别的行为标记语词典,并基于行为标记语词典自动标注扩充语料和基于特征分类识别,能够有效识别社交媒体中的用户交互意图,识别准确度高,可用于商务智能、社情舆情、决策评估等领域的意图分析与识别,应用范围广。

    一种面向微博的疑似水军发现方法

    公开(公告)号:CN106940732A

    公开(公告)日:2017-07-11

    申请号:CN201710212983.9

    申请日:2017-04-01

    Abstract: 本发明涉及一种面向微博数据的疑似水军发现方法,属于计算机应用技术领域。本发明共分为以下六个步骤,分别为相关微博数据的采集;数据预处理;用户特征提取;构建训练集;训练水军检测模型;预测判别未标注数据。对比现有技术,本发明实现了数据的充分利用,方便快捷的进行群体发现而不用建立复杂的分类检测模型,从而降低了算法的复杂度,并且算法的模块性较高,可以投入大规模数据计算,具有较高的稳定性;本发明除了可以对单一用户进行水军检测,还可以对某一特定事件中的一批用户进行识别,该方法模块性极强,可以稳定适用于大规模数据计算框架下。

Patent Agency Ranking