基于主题概率模型的微博传播群体划分与账户活跃度评估方法

    公开(公告)号:CN104991956A

    公开(公告)日:2015-10-21

    申请号:CN201510431015.8

    申请日:2015-07-21

    CPC classification number: G06F17/30864 G06Q50/01

    Abstract: 本发明涉及基于主题概率模型的微博传播群体划分与活跃度评估方法,有效解决按传播群体划分,将参与微博话题传播的账户划分为多个群组,量化每个群组中活跃的微博账户,方法是,以特定事件的关键词为基础,获取微博具体文本信息以及参与微博传播的账户集合,以单个微博的文本内容以及参与微博的账户集合输入,构造参与人员表,对样本库中的每一条微博基于主题概率生成模型,从构建的词汇表和参与人员表中根据模型中的群体-主题,主题-词以及群体-人抽样出词和参与人员,采用吉布斯抽样的方法进行计算,采用归并排序算法对每个主题下所包含的单词以及每个群体中所包含的人进行排序,本发明方法简单,及时掌握微博热点、情感倾向和舆论引导。

    基于合作博弈支持向量机的用户账号关联方法及其装置

    公开(公告)号:CN107070702B

    公开(公告)日:2019-12-10

    申请号:CN201710146243.X

    申请日:2017-03-13

    Abstract: 本发明涉及一种基于合作博弈支持向量机的用户账号关联方法及其装置,该方法包含:采用Pairwise思想通过源网络中的账号和目标网络中的账号构建出账号对集合,划分出训练集和测试集,使用高斯核支持向量机进行训练;对测试集中的账号对通过模型分别计算后验概率,并进行排序构建偏好顺序集;根据每个账号的偏好顺序集进行稳定匹配,得到所有账号之间的关联结果;在账号的偏好顺序基础上增加已关联账号作为先验知识,通过先验知识提升稳定匹配算法中的关联优先级,最终得到加强的账号关联结果。本发明方法简单,易于实现,能准确高效地发现用户关联的账号,为全面了解认识用户、充分管控检测用户提供了技术基础,具有较强的实际应用价值。

    一种短暂上网事务中频繁共现账号挖掘方法

    公开(公告)号:CN105224593A

    公开(公告)日:2016-01-06

    申请号:CN201510526575.1

    申请日:2015-08-25

    CPC classification number: G06F16/907

    Abstract: 本发明涉及短暂上网事务中频繁共现账号挖掘方法,有效解决对单个上网账号的行为审计扩大到相关的多种应用、多个账号上,从而实现对用户上网行为的跨数据流跟踪和审计的问题,方法是,基于网络分流技术,在网络关口处镜像网络原始数据,基于浮动关键字匹配、正则表达式过滤,对网络中不同应用对应的数据流进行识别,提取社交应用的用户上网数据,按时间和上网地址进行汇总整理,形成上网短暂事务数据库,对待分析的用户上网原始流量所对应的事务数据库中的事务数据,找出频繁项集,计算项集间的重叠率,对频繁项集进行合并,得到归属于同一社会人的多个网络账号,本发明方法简单、易操作,能准确发现隐藏在网络通信流中网络帐号之间的关联性。

    一种短暂上网事务中频繁共现账号挖掘方法

    公开(公告)号:CN105224593B

    公开(公告)日:2019-08-16

    申请号:CN201510526575.1

    申请日:2015-08-25

    Abstract: 本发明涉及短暂上网事务中频繁共现账号挖掘方法,有效解决对单个上网账号的行为审计扩大到相关的多种应用、多个账号上,从而实现对用户上网行为的跨数据流跟踪和审计的问题,方法是,基于网络分流技术,在网络关口处镜像网络原始数据,基于浮动关键字匹配、正则表达式过滤,对网络中不同应用对应的数据流进行识别,提取社交应用的用户上网数据,按时间和上网地址进行汇总整理,形成上网短暂事务数据库,对待分析的用户上网原始流量所对应的事务数据库中的事务数据,找出频繁项集,计算项集间的重叠率,对频繁项集进行合并,得到归属于同一社会人的多个网络账号,本发明方法简单、易操作,能准确发现隐藏在网络通信流中网络帐号之间的关联性。

    基于最大频繁项集挖掘的微博炒作群体发现方法

    公开(公告)号:CN103927398B

    公开(公告)日:2016-12-28

    申请号:CN201410188004.7

    申请日:2014-05-07

    Abstract: 本发明涉及基于最大频繁项集挖掘的微博炒作群体发现方法,有效解决微博炒作群体的发现,防止虚假恶意炒作的问题,方法是,以炒作微博的相关性为线索,基于爬虫技术或微博公共开放平台获取参与炒作微博传播的账户集合;以单个微博为事务,参与微博传播的账户为项,构建炒作微博事务数据库;对待检测微博组所对应的事务数据库中的每个事务,找出所有事务中包含的最大频繁项集,计算每个最大频繁项集间的重叠率,将规模小的项集归并到大项集中,减少交集次数,事务间取交集时,用二分查找法判断事务中是否包含某项目,提高挖掘最大频繁项集的效率,发现微博炒作群体,本发明方法简单,能准确发现恶意微博炒作群体,防止给社会造成的不良影响。

    基于最大频繁项集挖掘的微博炒作群体发现方法

    公开(公告)号:CN103927398A

    公开(公告)日:2014-07-16

    申请号:CN201410188004.7

    申请日:2014-05-07

    CPC classification number: G06F17/30864

    Abstract: 本发明涉及基于最大频繁项集挖掘的微博炒作群体发现方法,有效解决微博炒作群体的发现,防止虚假恶意炒作的问题,方法是,以炒作微博的相关性为线索,基于爬虫技术或微博公共开放平台获取参与炒作微博传播的账户集合;以单个微博为事务,参与微博传播的账户为项,构建炒作微博事务数据库;对待检测微博组所对应的事务数据库中的每个事务,找出所有事务中包含的最大频繁项集,计算每个最大频繁项集间的重叠率,将规模小的项集归并到大项集中,减少交集次数,事务间取交集时,用二分查找法判断事务中是否包含某项目,提高挖掘最大频繁项集的效率,发现微博炒作群体,本发明方法简单,能准确发现恶意微博炒作群体,防止给社会造成的不良影响。

    基于主题概率模型的微博传播群体划分与账户活跃度评估方法

    公开(公告)号:CN104991956B

    公开(公告)日:2018-07-31

    申请号:CN201510431015.8

    申请日:2015-07-21

    Abstract: 本发明涉及基于主题概率模型的微博传播群体划分与活跃度评估方法,有效解决按传播群体划分,将参与微博话题传播的账户划分为多个群组,量化每个群组中活跃的微博账户,方法是,以特定事件的关键词为基础,获取微博具体文本信息以及参与微博传播的账户集合,以单个微博的文本内容以及参与微博的账户集合输入,构造参与人员表,对样本库中的每条微博基于主题概率生成模型,从构建的词汇表和参与人员表中根据模型中的群体‑主题,主题‑词以及群体‑人抽样出词和参与人员,采用吉布斯抽样的方法进行计算,采用归并排序算法对每个主题下所包含的单词以及每个群体中所包含的人进行排序,本发明方法简单,及时掌握微博热点、情感倾向和舆论引导。

    基于合作博弈支持向量机的用户账号关联方法及其装置

    公开(公告)号:CN107070702A

    公开(公告)日:2017-08-18

    申请号:CN201710146243.X

    申请日:2017-03-13

    Abstract: 本发明涉及一种基于合作博弈支持向量机的用户账号关联方法及其装置,该方法包含:采用Pairwise思想通过源网络中的账号和目标网络中的账号构建出账号对集合,划分出训练集和测试集,使用高斯核支持向量机进行训练;对测试集中的账号对通过模型分别计算后验概率,并进行排序构建偏好顺序集;根据每个账号的偏好顺序集进行稳定匹配,得到所有账号之间的关联结果;在账号的偏好顺序基础上增加已关联账号作为先验知识,通过先验知识提升稳定匹配算法中的关联优先级,最终得到加强的账号关联结果。本发明方法简单,易于实现,能准确高效地发现用户关联的账号,为全面了解认识用户、充分管控检测用户提供了技术基础,具有较强的实际应用价值。

Patent Agency Ranking