一种基于用户影响力以及内容的微博传播预测方法

    公开(公告)号:CN106991160B

    公开(公告)日:2020-07-24

    申请号:CN201710203904.8

    申请日:2017-03-30

    Applicant: 武汉大学

    Abstract: 本文发明涉及一种基于用户影响力以及内容的微博传播预测方法,流程如下:1.利用scrapy技术对两个用户的个人信息和他们之间的转发关系及转发微博进行爬取。2.利用RankPage影响力分析技术提取用户影响力,形成用户权威预测因子。3.采用单位时间粉丝转发微博在所有发表微博的百分比,提取粉丝转发活跃度预测因子。4.采用TF‑IDF词语权重技术对微博内容进行重要性分析,提取微博重要性预测因子。5.利用滚雪球的抽样方法将提取到的转发关系划分成10折微博转发训练集和微博忽略训练集6.利用有监督的贝叶斯网络对训练集进行训练,直至分类器参数收敛。利用本发明可以提高针对新浪微博特定粉丝转发微博预测的准确度。

    基于CPU多线程与GPU多粒度并行及协同优化的方法

    公开(公告)号:CN106991011B

    公开(公告)日:2020-07-24

    申请号:CN201710204293.9

    申请日:2017-03-30

    Applicant: 武汉大学

    Abstract: 本发明涉及一种针对大数据任务处理的基于CPU多线程与GPU多粒度并行及协同优化的方法,首先创建主线程,根据已知参数计算CPU_GPU最佳任务划分。启动n个线程,其中1个负责调度GPU,其余负责执行CPU计算任务。然后采用内存池技术降低数据从磁盘读入内存的通信开销;采用哈希表和信息摘要解决多线程访存中资源竞争的问题;采用流水线技术隐藏数据从内存读入CPU的通信时间。在主机端,CPU采用多核多线程方式执行分配到的任务;在设备端,GPU采用CUDA并行方式执行分配到的任务。全部任务完成后,主线程收回控制权直至退出。本发明可以在大数据任务处理中取得明显的加速效果,降低任务总的处理时间,提高处理效率。

    一种传播网络的关键路径提取方法

    公开(公告)号:CN108183956B

    公开(公告)日:2020-05-12

    申请号:CN201711475729.4

    申请日:2017-12-29

    Applicant: 武汉大学

    Abstract: 本发明公开了一种传播网络的关键路径提取方法,传播网络中添加一个额外节点,并与传播网络中的每一个节点建立双向连接;计算额外节点传播网络中任意两节点间的节点相似度;通过额外节点传播网络中节点总数初始化节点影响力列向量,并建立概率转移矩阵,进行全局投票迭代以更新节点影响力列向量;遍历排除额外节点传播网络中任意两个用户节点的最短路径,并对每条最短路径构建路径节点影响力行向量以及路径节点相似度行向量;进一步计算得到每条最短路径的路径综合影响力以对每条最短路径进行排序得到关键路径。本发明解决了社交网络平台上关键传播路径的挖掘问题,并可用于舆情监控与干预、谣言检测等网络信息监控领域。

    一种基于用户历史网络潜在有害主题引导方法

    公开(公告)号:CN108536757A

    公开(公告)日:2018-09-14

    申请号:CN201810224888.5

    申请日:2018-03-19

    Applicant: 武汉大学

    Abstract: 本发明涉及一种基于用户历史网络潜在有害主题引导方法。流程如下:1.根据有害信息的传播方式(如评论、转发等)构建分级评估指标体系,再利用情感倾向性算法构建危害分级模型。2.对危害信息进行主题分类并确定信息的危害级别,然后标记浏览过这些信息的用户。3.根据1中算法去获取每个级别下各个类别的无危害信息,构建分级推荐模型。4.分离出浏览过危害信息的所有用户,并对这些用户进行一段时间的网络浏览痕迹跟踪,并通过预警,查封,推荐,释放四种种方式来干预和释放用户。通过本发明可以渐渐的改变危害信息受众用户的阅读取向,从而间接的净化互联网环境,还可以加强相关部门对危害信息发布人的打击力度和准确度。

    一种基于信息传播的微博社交关系提取算法

    公开(公告)号:CN106991617B

    公开(公告)日:2020-07-10

    申请号:CN201710203903.3

    申请日:2017-03-30

    Applicant: 武汉大学

    Abstract: 本发明涉及一种基于信息传播的微博社交关系提取算法,包括:1.使用平台开放接口或者爬虫软件获得微博数据,以及微博下的评论与转发数据。2.以用户为基本单位检索出其原创微博,对于每一条原创微博,创建微博信息传播树,对树的边赋予权重。3.通过信息传播树,反演化用户社交关系树。4.单用户社交关系融合。5.多用户社交关系融合。通过本发明可以重新获得基于信息传播的微博用户间的社交关系,同时,通过赋予权重等手段,可以对用户间的亲密关系进行量化处理。经过本发明算法的数据处理后,获得的微博用户社交拓扑结构,是对在线社交网络进一步分析应用的重要数据基础。

    一种基于信息传播的微博社交关系提取算法

    公开(公告)号:CN106991617A

    公开(公告)日:2017-07-28

    申请号:CN201710203903.3

    申请日:2017-03-30

    Applicant: 武汉大学

    Abstract: 本发明涉及一种基于信息传播的微博社交关系提取算法,包括:1.使用平台开放接口或者爬虫软件获得微博数据,以及微博下的评论与转发数据。2.以用户为基本单位检索出其原创微博,对于每一条原创微博,创建微博信息传播树,对树的边赋予权重。3.通过信息传播树,反演化用户社交关系树。4.单用户社交关系融合。5.多用户社交关系融合。通过本发明可以重新获得基于信息传播的微博用户间的社交关系,同时,通过赋予权重等手段,可以对用户间的亲密关系进行量化处理。经过本发明算法的数据处理后,获得的微博用户社交拓扑结构,是对在线社交网络进一步分析应用的重要数据基础。

    一种基于用户影响力以及内容的微博传播预测方法

    公开(公告)号:CN106991160A

    公开(公告)日:2017-07-28

    申请号:CN201710203904.8

    申请日:2017-03-30

    Applicant: 武汉大学

    CPC classification number: G06F16/951 G06Q50/01

    Abstract: 本文发明涉及一种基于用户影响力以及内容的微博传播预测方法,流程如下:1.利用scrapy技术对两个用户的个人信息和他们之间的转发关系及转发微博进行爬取。2.利用RankPage影响力分析技术提取用户影响力,形成用户权威预测因子。3.采用单位时间粉丝转发微博在所有发表微博的百分比,提取粉丝转发活跃度预测因子。4.采用TF‑IDF词语权重技术对微博内容进行重要性分析,提取微博重要性预测因子。5.利用滚雪球的抽样方法将提取到的转发关系划分成10折微博转发训练集和微博忽略训练集。6.利用有监督的贝叶斯网络对训练集进行训练,直至分类器参数收敛。利用本发明可以提高针对新浪微博特定粉丝转发微博预测的准确度。

    基于内容、用户多因素分析的社交网络谣言检测方法

    公开(公告)号:CN108038240A

    公开(公告)日:2018-05-15

    申请号:CN201711453302.4

    申请日:2017-12-26

    Applicant: 武汉大学

    Abstract: 本发明提供一种基于内容、用户多因素分析的社交网络谣言检测方法,包括:步骤a,获取文本信息例,并获取文本信息例的文本信息和用户信息;步骤b,根据文本信息,建文本信息例的文本内容特征模型,文本内容特征模型包括关键词匹配模型、情感倾向模型、情感波动模型、主题聚类匹配模型和内容影响力评价模型;步骤c,根据用户信息,构建所述文本信息例的用户特征模型,用户特征模型包括内容一致性评判模型和用户影响力评价模型。步骤d,根据文本内容特征模型和用户特征模型,构建特征向量,训练分类器,将特征向量输入分类器并输出结果,以完成识别社交网络谣言。本发明不依靠单一特征进行检测,避免谣言的误查,提高检测精度。

Patent Agency Ranking