-
公开(公告)号:CN107247751B
公开(公告)日:2020-01-14
申请号:CN201710386864.5
申请日:2017-05-26
Applicant: 武汉大学
IPC: G06F16/9535 , G06F16/35
Abstract: 本发明公开了一种基于LDA主题模型的内容推荐方法,该方法针对不同一级话题建立不同主题模型,利用模型对网站论坛的用户输入进行主题分析,提炼出五个主题词,形成主题标签组,和用户标签组。然后直接根据主题标签组和用户标签组进行相似度匹配,从而进行相关内容推荐。本发明方法有效地简化了传统内容推荐方法,提高了内容推荐的及时性。
-
公开(公告)号:CN107391452B
公开(公告)日:2020-01-07
申请号:CN201710548391.4
申请日:2017-07-06
Applicant: 武汉大学
IPC: G06F17/18
Abstract: 本发明针对软件缺陷数据集中数据极度不平衡会降低软件缺陷数目预测模型的性能的问题,提出了一种基于数据欠采样和集成学习的软件缺陷数目预测方法。本发明设计了合理的不平衡数据处理策略,首先利用随机欠采样技术通过删除缺陷数据集中缺陷数目为零的软件模块得到相对平衡的新数据集,然后利用相对平衡的缺陷数据集训练出若干个弱的软件缺陷数目预测模型,最后集成这些弱的软件缺陷数目预测模型来预测待预测的软件模块的缺陷数目。本发明的技术方案既能够解决缺陷数据集中数据不平衡的问题,又能够结合多个弱的预测模型来提高软件缺陷数目预测模型的性能。
-
公开(公告)号:CN107145548B
公开(公告)日:2019-08-20
申请号:CN201710284017.8
申请日:2017-04-26
Applicant: 武汉大学
IPC: G06F16/2458 , G06F16/23
Abstract: 本发明公开了一种基于Spark平台的并行序列模式挖掘方法,针对现有的串行化序列模式挖掘算法在处理海量数据时计算能力低效的问题和现有的基于Hadoop的并行序列模式挖掘算法具有高IO开销和负载不平衡的问题,设计了合理的序列数据库分解策略,最大限度的解决了负载不平衡的问题。在此基础上根据MapReduce编程框架的特性,对原始GSP算法进行了并行化,利用Spark云计算平台的大规模并行计算能力提高了海量数据序列模式挖掘效率。
-
公开(公告)号:CN108897769A
公开(公告)日:2018-11-27
申请号:CN201810531534.5
申请日:2018-05-29
Applicant: 武汉大学
IPC: G06F17/30
Abstract: 本发明公开了一种基于生成式对抗网络实现文本分类数据集扩展方法,该方法包括以下步骤:确定需要进行数据扩展的原始数据类别;对相应数据进行预处理,使用word2vec与TFIDF将数据表示成词向量矩阵的形式;使用生成式对抗网路生成扩展的矩阵向量,将原数据的矩阵向量与扩展的矩阵向量合并即实现对数据集的扩展。本发明方法通过扩展稀有类别的数据,有利于研究者对难以获得的数据集进行扩展,提高稀有类别数据的分类精度,方便科学研究。
-
公开(公告)号:CN108763466A
公开(公告)日:2018-11-06
申请号:CN201810529188.7
申请日:2018-05-29
Applicant: 武汉大学
CPC classification number: G06F17/277
Abstract: 本发明公开了一种基于位置实体的跨媒体用户身份匹配方法,该方法通过建立用户位置实体矩阵,利用聚类算法K‑means实现对位置相似用户聚类,基于同类用户已有的实际位置标签,实现目标用户虚拟现实位置映射,然后为了挖掘目标用户在多个社交媒体的账户,基于目标用户在某一社交媒体上的位置实体矩阵,计算其与其他社交媒体账户的位置实体矩阵的汉明距离,实现跨媒体用户身份匹配。本发明方法基于位置实体进行用户身份匹配准确度高,有利于全面了解用户喜好,实现精准推荐。
-
公开(公告)号:CN107391483A
公开(公告)日:2017-11-24
申请号:CN201710572175.3
申请日:2017-07-13
Applicant: 武汉大学
Abstract: 本发明公开了一种基于卷积神经网络的商品评论数据情感分类方法,针对传统的词向量表示方法只提取词汇特征和句法特征,而忽略了词语之间的语义关系的问题,传统的分类算法分类效果能以再被提升的问题,提出了一个基于卷积神经网络的商品评论数据情感分类方法。首先利用CBOW模型提取出每条评论数据的词向量特征,增强了词语之间的语义关系和词向量特征的表达能力,然后利用卷积神经网络模型这个深度学习网络模型建立情感分类模型,提升了评论数据的情感分类性能。本发明的技术方案具有简单、快速的特点,能够较好地提高评论数据情感分类的分类性能。
-
公开(公告)号:CN104717291B
公开(公告)日:2017-11-14
申请号:CN201510124213.X
申请日:2015-03-20
Applicant: 武汉大学
Abstract: 本发明提供了一种基于传感器实时监测网络的地铁火灾逃生系统及方法,包括监测装置、控制中心、带惯性导航系统和无线传输系统的移动终端和AP集群,监测装置、控制中心、移动终端通过AP集群组成的WIFI网络进行数据交互;监测装置进一步包括火情监测装置和人流量统计装置,其中,火情监测装置监测范围覆盖整个地铁站,主要用于监测地铁站内是否发生火情;人流量检测装置监测范围覆盖地铁站的进站口、出站口、楼梯、拐角等乘客必经处,用于统计人流量进而判断路线拥堵情况。本发明可为火灾时地铁站内乘客疏散提供了切实可行的解决方案,提高了火灾疏散效率,从而进一步减少人员伤亡。
-
公开(公告)号:CN107273666A
公开(公告)日:2017-10-20
申请号:CN201710386321.3
申请日:2017-05-26
Applicant: 武汉大学
IPC: G06F19/00
Abstract: 本发明公开了一种人体健康数据综合分析系统,该系统包括:用户信息模块,健康数据模块,用户标签模块,设备信息采集模块,健康分析模块;所述用户信息模块用于通过数据表存储所有用户的信息;所述设备信息采集模块,用于通过蓝牙接口从健康设备采集健康数据,并通过post请求向服务器发送测得的健康数据;所述健康数据模块,用于通过一张数据表存储所有通过健康设备采集的数据信息;所述健康分析模块,用于根据健康数据模块存储的数据信息和用户信息模块存储的用户信息制作健康分析报告;所述用户标签模块,用于根据用户在健康论坛发布的内容设置用户标签,并根据用户标签向用户推送文章。
-
公开(公告)号:CN107247666A
公开(公告)日:2017-10-13
申请号:CN201710375644.2
申请日:2017-05-24
Applicant: 武汉大学
IPC: G06F11/36
Abstract: 本发明属于软件缺陷预测技术领域,特别是涉及一种基于特征选择和集成学习的软件缺陷个数预测方法,针对软件缺陷个数的预测中不相关的模块特征损害了缺陷预测模型性能,回归模型均具有不同的预测能力,无法选择最佳回归算法等问题,首先利用基于包裹式的特征选择方法过滤不相关和冗余的特征,然后采用六种不同的回归算法:线性回归、岭回归、决策树回归、梯度boosting回归、最近邻回归和多层感知器回归,采用集成学习技术,根据特征筛选后的数据实例,构建综合回归模型。相比于单个的回归模型,本发明提高了软件缺陷个数预测的准确性。
-
公开(公告)号:CN107203592A
公开(公告)日:2017-09-26
申请号:CN201710277470.6
申请日:2017-04-25
Applicant: 武汉大学
Abstract: 本发明涉及一种基于三点定位法的推送信息采信检测方法,利用主观消息中的位置信息这个客观因素作为评价参考,无添加新的评价标准,有效降低检验过程的复杂度,应用三点定位法,通过智能手机中的电子地图的定位功能辅助,依据几何扫描算法给出了一个重要的距离计算算法,初步判定信息提供者所在区域范围,并将其与信息发生区域进行比对,粗粒度地检验出可靠的时效信息。
-
-
-
-
-
-
-
-
-