-
公开(公告)号:CN106445975A
公开(公告)日:2017-02-22
申请号:CN201510493081.8
申请日:2015-08-12
Applicant: 哈尔滨工业大学深圳研究生院 , 腾讯科技(深圳)有限公司
IPC: G06F17/30
Abstract: 本发明公开了一种项集挖掘方法及装置,属于数据挖掘领域。所述方法包括:获取自定义的多重最低效用阈值MMU表;MMU表中包括数据库D中各个数据项与最低效用阈值的对应关系;计算数据库D中项集的项集效用值;根据MMU表,计算数据库D中各个项集各自对应的项集最低效用阈值MIU;项集中包含至少一个数据项;当项集效用值≥MIU时,将该项集确定为高效用项集HUI。本发明解决了现有的基于HUIM的算法中,都是将项集的项集效用值是否大于唯一的最低效用阈值作为衡量标准,导致挖掘出的HUI不准确的问题,达到了根据不同项集制定不同的HUI衡量标准,从而提高挖掘出的HUI准确性的效果。
-
公开(公告)号:CN106933886B
公开(公告)日:2020-12-18
申请号:CN201511030144.2
申请日:2015-12-31
Applicant: 哈尔滨工业大学深圳研究生院 , 腾讯科技(深圳)有限公司
IPC: G06F16/2458
Abstract: 本发明公开了一种数据处理的方法和装置,属于计算机技术领域。所述方法包括:获取样本数据记录,根据每条样本数据记录中的参数项和对应的参数值,以及预设的隶属度函数,确定每个参数值对应的参数值等级和参数值等级的权值,并根据每条样本数据记录中各参数值等级的权值,选取样本总权值大于预设阈值的参数值等级;根据在每条样本数据记录中所述选取的参数值等级对应的权值,确定满足预设组合条件的参数值等级,分别基于每个满足预设组合条件的参数值等级,确定参数值等级组合;确定每个所述参数值等级组合对应的样本总权值,输出样本总权值大于预设阈值的参数值等级组合。采用本发明,可以节约处理资源。
-
公开(公告)号:CN106933886A
公开(公告)日:2017-07-07
申请号:CN201511030144.2
申请日:2015-12-31
Applicant: 哈尔滨工业大学深圳研究生院 , 腾讯科技(深圳)有限公司
IPC: G06F17/30
CPC classification number: G06F16/2458
Abstract: 本发明公开了一种数据处理的方法和装置,属于计算机技术领域。所述方法包括:获取样本数据记录,根据每条样本数据记录中的参数项和对应的参数值,以及预设的隶属度函数,确定每个参数值对应的参数值等级和参数值等级的权值,并根据每条样本数据记录中各参数值等级的权值,选取样本总权值大于预设阈值的参数值等级;根据在每条样本数据记录中所述选取的参数值等级对应的权值,确定满足预设组合条件的参数值等级,分别基于每个满足预设组合条件的参数值等级,确定参数值等级组合;确定每个所述参数值等级组合对应的样本总权值,输出样本总权值大于预设阈值的参数值等级组合。采用本发明,可以节约处理资源。
-
-