-
公开(公告)号:CN106991160B
公开(公告)日:2020-07-24
申请号:CN201710203904.8
申请日:2017-03-30
Applicant: 武汉大学
IPC: G06F16/9536 , G06Q50/00
Abstract: 本文发明涉及一种基于用户影响力以及内容的微博传播预测方法,流程如下:1.利用scrapy技术对两个用户的个人信息和他们之间的转发关系及转发微博进行爬取。2.利用RankPage影响力分析技术提取用户影响力,形成用户权威预测因子。3.采用单位时间粉丝转发微博在所有发表微博的百分比,提取粉丝转发活跃度预测因子。4.采用TF‑IDF词语权重技术对微博内容进行重要性分析,提取微博重要性预测因子。5.利用滚雪球的抽样方法将提取到的转发关系划分成10折微博转发训练集和微博忽略训练集6.利用有监督的贝叶斯网络对训练集进行训练,直至分类器参数收敛。利用本发明可以提高针对新浪微博特定粉丝转发微博预测的准确度。
-
公开(公告)号:CN106991011B
公开(公告)日:2020-07-24
申请号:CN201710204293.9
申请日:2017-03-30
Applicant: 武汉大学
IPC: G06F9/50
Abstract: 本发明涉及一种针对大数据任务处理的基于CPU多线程与GPU多粒度并行及协同优化的方法,首先创建主线程,根据已知参数计算CPU_GPU最佳任务划分。启动n个线程,其中1个负责调度GPU,其余负责执行CPU计算任务。然后采用内存池技术降低数据从磁盘读入内存的通信开销;采用哈希表和信息摘要解决多线程访存中资源竞争的问题;采用流水线技术隐藏数据从内存读入CPU的通信时间。在主机端,CPU采用多核多线程方式执行分配到的任务;在设备端,GPU采用CUDA并行方式执行分配到的任务。全部任务完成后,主线程收回控制权直至退出。本发明可以在大数据任务处理中取得明显的加速效果,降低任务总的处理时间,提高处理效率。
-
公开(公告)号:CN108183956B
公开(公告)日:2020-05-12
申请号:CN201711475729.4
申请日:2017-12-29
Applicant: 武汉大学
IPC: H04L29/08 , H04L12/721
Abstract: 本发明公开了一种传播网络的关键路径提取方法,传播网络中添加一个额外节点,并与传播网络中的每一个节点建立双向连接;计算额外节点传播网络中任意两节点间的节点相似度;通过额外节点传播网络中节点总数初始化节点影响力列向量,并建立概率转移矩阵,进行全局投票迭代以更新节点影响力列向量;遍历排除额外节点传播网络中任意两个用户节点的最短路径,并对每条最短路径构建路径节点影响力行向量以及路径节点相似度行向量;进一步计算得到每条最短路径的路径综合影响力以对每条最短路径进行排序得到关键路径。本发明解决了社交网络平台上关键传播路径的挖掘问题,并可用于舆情监控与干预、谣言检测等网络信息监控领域。
-
公开(公告)号:CN108536757A
公开(公告)日:2018-09-14
申请号:CN201810224888.5
申请日:2018-03-19
Applicant: 武汉大学
Abstract: 本发明涉及一种基于用户历史网络潜在有害主题引导方法。流程如下:1.根据有害信息的传播方式(如评论、转发等)构建分级评估指标体系,再利用情感倾向性算法构建危害分级模型。2.对危害信息进行主题分类并确定信息的危害级别,然后标记浏览过这些信息的用户。3.根据1中算法去获取每个级别下各个类别的无危害信息,构建分级推荐模型。4.分离出浏览过危害信息的所有用户,并对这些用户进行一段时间的网络浏览痕迹跟踪,并通过预警,查封,推荐,释放四种种方式来干预和释放用户。通过本发明可以渐渐的改变危害信息受众用户的阅读取向,从而间接的净化互联网环境,还可以加强相关部门对危害信息发布人的打击力度和准确度。
-
公开(公告)号:CN106991617B
公开(公告)日:2020-07-10
申请号:CN201710203903.3
申请日:2017-03-30
Applicant: 武汉大学
IPC: G06F16/9536 , G06Q50/00
Abstract: 本发明涉及一种基于信息传播的微博社交关系提取算法,包括:1.使用平台开放接口或者爬虫软件获得微博数据,以及微博下的评论与转发数据。2.以用户为基本单位检索出其原创微博,对于每一条原创微博,创建微博信息传播树,对树的边赋予权重。3.通过信息传播树,反演化用户社交关系树。4.单用户社交关系融合。5.多用户社交关系融合。通过本发明可以重新获得基于信息传播的微博用户间的社交关系,同时,通过赋予权重等手段,可以对用户间的亲密关系进行量化处理。经过本发明算法的数据处理后,获得的微博用户社交拓扑结构,是对在线社交网络进一步分析应用的重要数据基础。
-
公开(公告)号:CN108536781A
公开(公告)日:2018-09-14
申请号:CN201810271740.7
申请日:2018-03-29
Applicant: 武汉大学
Abstract: 本发明属于数据挖掘、舆情分析的研究范畴,涉及一种社交网络情绪焦点的挖掘方法及系统,包括:语料数据预处理、神经网络模型构建及训练、情绪焦点聚类三个步骤。深入挖掘用户在社交网络中展现的情绪的关注焦点,从而为社会舆论引导提供更为明确的决策辅助。本发明可用于舆情监控与干预、谣言检测等网络信息监管领域。
-
公开(公告)号:CN106991617A
公开(公告)日:2017-07-28
申请号:CN201710203903.3
申请日:2017-03-30
Applicant: 武汉大学
IPC: G06Q50/00
Abstract: 本发明涉及一种基于信息传播的微博社交关系提取算法,包括:1.使用平台开放接口或者爬虫软件获得微博数据,以及微博下的评论与转发数据。2.以用户为基本单位检索出其原创微博,对于每一条原创微博,创建微博信息传播树,对树的边赋予权重。3.通过信息传播树,反演化用户社交关系树。4.单用户社交关系融合。5.多用户社交关系融合。通过本发明可以重新获得基于信息传播的微博用户间的社交关系,同时,通过赋予权重等手段,可以对用户间的亲密关系进行量化处理。经过本发明算法的数据处理后,获得的微博用户社交拓扑结构,是对在线社交网络进一步分析应用的重要数据基础。
-
公开(公告)号:CN106991160A
公开(公告)日:2017-07-28
申请号:CN201710203904.8
申请日:2017-03-30
Applicant: 武汉大学
CPC classification number: G06F16/951 , G06Q50/01
Abstract: 本文发明涉及一种基于用户影响力以及内容的微博传播预测方法,流程如下:1.利用scrapy技术对两个用户的个人信息和他们之间的转发关系及转发微博进行爬取。2.利用RankPage影响力分析技术提取用户影响力,形成用户权威预测因子。3.采用单位时间粉丝转发微博在所有发表微博的百分比,提取粉丝转发活跃度预测因子。4.采用TF‑IDF词语权重技术对微博内容进行重要性分析,提取微博重要性预测因子。5.利用滚雪球的抽样方法将提取到的转发关系划分成10折微博转发训练集和微博忽略训练集。6.利用有监督的贝叶斯网络对训练集进行训练,直至分类器参数收敛。利用本发明可以提高针对新浪微博特定粉丝转发微博预测的准确度。
-
公开(公告)号:CN107103093B
公开(公告)日:2020-03-10
申请号:CN201710345317.2
申请日:2017-05-16
Applicant: 武汉大学
IPC: G06F40/30 , G06F16/335 , G06F16/33
Abstract: 本发明涉及一种短文本推荐方法及装置,属于信息处理技术领域,具体涉及一种基于用户行为和情感分析的短文本推荐方法及装置。本发明结合用户历史行为以及用户历史短文本情感,通过情感负相关性分析,匹配相关类别的短文本和用户,推荐相关短文本。
-
公开(公告)号:CN108038240A
公开(公告)日:2018-05-15
申请号:CN201711453302.4
申请日:2017-12-26
Applicant: 武汉大学
Abstract: 本发明提供一种基于内容、用户多因素分析的社交网络谣言检测方法,包括:步骤a,获取文本信息例,并获取文本信息例的文本信息和用户信息;步骤b,根据文本信息,建文本信息例的文本内容特征模型,文本内容特征模型包括关键词匹配模型、情感倾向模型、情感波动模型、主题聚类匹配模型和内容影响力评价模型;步骤c,根据用户信息,构建所述文本信息例的用户特征模型,用户特征模型包括内容一致性评判模型和用户影响力评价模型。步骤d,根据文本内容特征模型和用户特征模型,构建特征向量,训练分类器,将特征向量输入分类器并输出结果,以完成识别社交网络谣言。本发明不依靠单一特征进行检测,避免谣言的误查,提高检测精度。
-
-
-
-
-
-
-
-
-