-
公开(公告)号:CN106033447A
公开(公告)日:2016-10-19
申请号:CN201510115234.5
申请日:2015-03-16
Applicant: 哈尔滨工业大学深圳研究生院 , 深圳市腾讯计算机系统有限公司
IPC: G06F17/30
Abstract: 本发明公开了一种项集挖掘方法及装置,属于数据挖掘领域。所述方法包括:获取自定义的最小期望支持度μ和最低效用比例ε;计算不确定性数据库D中项集的实际期望支持度expSup和实际效用值u,该项集中包含至少一个数据项;当expSup≥|D|*μ,且u≥总效用值TU*ε时,确定该项集为高概率且高效用项集;TU表示不确定性数据库D中所有数据项的效用之和;|D|表示不确定性数据库D中包含的事务总数。本发明达到了挖掘出的项集效用值较高,且发生概率较大,从而保证挖掘出的项集具有较高的实际使用价值的效果。
-
公开(公告)号:CN106033424B
公开(公告)日:2020-04-21
申请号:CN201510106336.0
申请日:2015-03-11
Applicant: 哈尔滨工业大学深圳研究生院 , 深圳市腾讯计算机系统有限公司
IPC: G06F16/2458 , G06F16/2455 , G06F9/46
Abstract: 本发明公开了一种数据挖掘方法和装置,属于数据挖掘领域。方法包括:扫描事务数据库,得到多个事务以及至少一个项目;获取多个候选项集;对于每个候选项集,根据候选项集中每个项目的权重以及包括候选项集的指定事务的数目,计算候选项集的加权支持度;根据每个指定事务的发生时间,计算候选项集的时效值;判断候选项集的时效值是否大于第一阈值,以及加权支持度是否大于第二阈值;当时效值大于第一阈值且加权支持度大于第二阈值时,将候选项集确定为近期高权重频繁项集。本发明考虑到项集的时效性因素,降低了出现干扰的可能性,且挖掘出的近期高权重频繁项集中的项目之间的关联规则可以准确体现近期的关联规则,提高了准确性和实用性。
-
公开(公告)号:CN106033576A
公开(公告)日:2016-10-19
申请号:CN201510106783.6
申请日:2015-03-11
Applicant: 哈尔滨工业大学深圳研究生院 , 深圳市腾讯计算机系统有限公司
IPC: G06Q30/02
Abstract: 本发明公开了一种对象信息的展示方法和装置,属于互联网技术领域。所述方法包括:获取目标店铺中各对象对应的利润值,以及当前时间点之前预设时长的历史时段内所述各对象的交易数量;根据所述各对象对应的利润值和所述各对象的交易数量,在所述各对象中,选取在所述历史时段内的累计利润值满足预设的利润值条件的对象,作为待展示对象;对所述待展示对象的对象信息进行展示。采用本发明,可以提高展示对象信息的灵活性。
-
公开(公告)号:CN106033472A
公开(公告)日:2016-10-19
申请号:CN201510126268.4
申请日:2015-03-20
Applicant: 哈尔滨工业大学深圳研究生院 , 深圳市腾讯计算机系统有限公司
Abstract: 本发明公开了一种挖掘物品信息的方法及装置,属于计算机及通信领域。所述方法包括:从第一数据库中获取发生修改的第一转移记录以及从第二数据库中获取所述第一转移记录对应的第二转移记录,所述第二数据库是所述第一数据库修改前的数据库;获取所述第一转移记录中包括的各物品和所述第二转移记录中包括的各物品;根据获取的每个物品的第一事务加权效用值,所述第一转移记录和所述第二转移记录,计算所述每个物品的第二事务加权效用值,物品的第一事务加权效用值是根据所述第二数据库计算得到的;从所述每个物品中选择第二事务加权效用值满足预设条件的物品信息。本发明能够提高基于数据库发生修改操作环境下的挖掘物品信息的效率。
-
公开(公告)号:CN106033576B
公开(公告)日:2020-08-11
申请号:CN201510106783.6
申请日:2015-03-11
Applicant: 哈尔滨工业大学深圳研究生院 , 深圳市腾讯计算机系统有限公司
IPC: G06Q30/02
Abstract: 本发明公开了一种对象信息的展示方法和装置,属于互联网技术领域。所述方法包括:获取目标店铺中各对象对应的利润值,以及当前时间点之前预设时长的历史时段内所述各对象的交易数量;根据所述各对象对应的利润值和所述各对象的交易数量,在所述各对象中,选取在所述历史时段内的累计利润值满足预设的利润值条件的对象,作为待展示对象;对所述待展示对象的对象信息进行展示。采用本发明,可以提高展示对象信息的灵活性。
-
公开(公告)号:CN106033447B
公开(公告)日:2020-04-21
申请号:CN201510115234.5
申请日:2015-03-16
Applicant: 哈尔滨工业大学深圳研究生院 , 深圳市腾讯计算机系统有限公司
IPC: G06F16/2458
Abstract: 本发明公开了一种项集挖掘方法及装置,属于数据挖掘领域。所述方法包括:获取自定义的最小期望支持度μ和最低效用比例ε;计算不确定性数据库D中项集的实际期望支持度expSup和实际效用值u,该项集中包含至少一个数据项;当expSup≥|D|*μ,且u≥总效用值TU*ε时,确定该项集为高概率且高效用项集;TU表示不确定性数据库D中所有数据项的效用之和;|D|表示不确定性数据库D中包含的事务总数。本发明达到了挖掘出的项集效用值较高,且发生概率较大,从而保证挖掘出的项集具有较高的实际使用价值的效果。
-
公开(公告)号:CN106033472B
公开(公告)日:2019-08-27
申请号:CN201510126268.4
申请日:2015-03-20
Applicant: 哈尔滨工业大学深圳研究生院 , 深圳市腾讯计算机系统有限公司
IPC: G06F16/2458 , G06F16/28 , G06Q30/02
Abstract: 本发明公开了一种挖掘物品信息的方法及装置,属于计算机及通信领域。所述方法包括:从第一数据库中获取发生修改的第一转移记录以及从第二数据库中获取所述第一转移记录对应的第二转移记录,所述第二数据库是所述第一数据库修改前的数据库;获取所述第一转移记录中包括的各物品和所述第二转移记录中包括的各物品;根据获取的每个物品的第一事务加权效用值,所述第一转移记录和所述第二转移记录,计算所述每个物品的第二事务加权效用值,物品的第一事务加权效用值是根据所述第二数据库计算得到的;从所述每个物品中选择第二事务加权效用值满足预设条件的物品的物品信息。本发明能够提高基于数据库发生修改操作环境下的挖掘物品信息的效率。
-
公开(公告)号:CN106033424A
公开(公告)日:2016-10-19
申请号:CN201510106336.0
申请日:2015-03-11
Applicant: 哈尔滨工业大学深圳研究生院 , 深圳市腾讯计算机系统有限公司
IPC: G06F17/30
Abstract: 本发明公开了一种数据挖掘方法和装置,属于数据挖掘领域。方法包括:扫描事务数据库,得到多个事务以及至少一个项目;获取多个候选项集;对于每个候选项集,根据候选项集中每个项目的权重以及包括候选项集的指定事务的数目,计算候选项集的加权支持度;根据每个指定事务的发生时间,计算候选项集的时效值;判断候选项集的时效值是否大于第一阈值,以及加权支持度是否大于第二阈值;当时效值大于第一阈值且加权支持度大于第二阈值时,将候选项集确定为近期高权重频繁项集。本发明考虑到项集的时效性因素,降低了出现干扰的可能性,且挖掘出的近期高权重频繁项集中的项目之间的关联规则可以准确体现近期的关联规则,提高了准确性和实用性。
-
公开(公告)号:CN108733705A
公开(公告)日:2018-11-02
申请号:CN201710261885.4
申请日:2017-04-20
Applicant: 哈尔滨工业大学深圳研究生院 , 腾讯科技(深圳)有限公司
IPC: G06F17/30
Abstract: 本申请公开了一种高效用序列模式挖掘方法及装置,根据序列数据库中包含的各事务,获取满足设定条件的候选序列模式集合;针对每一所述候选序列模式,确定所述候选序列模式在所述序列数据库中的效用值;将所述效用值不低于自身所对应的效用阀值的候选序列模式,确定为挖掘结果,其中,候选序列模式对应的效用阀值为该候选序列模式所包含各项目中,效用阀值最低的项目的效用阀值,序列数据库中每一项目的效用阀值由用户预先设定。本申请可以由用户根据需要对不同项目设置不同的效用阀值,基于此从序列数据库中挖掘效用值不低于自身对应的效用阀值的序列模式,在挖掘高效用模式的基础上,能够实现个性化挖掘,满足不同应用场景的需求。
-
公开(公告)号:CN107870956A
公开(公告)日:2018-04-03
申请号:CN201610866557.2
申请日:2016-09-28
Applicant: 腾讯科技(深圳)有限公司 , 哈尔滨工业大学深圳研究生院
CPC classification number: G06F17/30539 , G06Q30/0631
Abstract: 本发明实施例提供一种高效用项集挖掘方法、装置及数据处理设备,该方法包括:确定事务数据库中各项集对应的项集效用值;根据预定义的最低效用阈值表,确定各项集对应的项集最低效用阈值;预定义的最低效用阈值表记录有各数据项对应的最低效用阈值,一个项集对应的项集最低效用阈值表示的是,该项集包含的数据项所对应的最低效用阈值中的最小最低效用阈值。将各项集的项集效用值与对应的项集最低效用阈值进行比对,根据比对结果确定高效用项集,其中,高效用项集的项集效用值不小于对应的项集最低效用阈值。本发明实施例提高了高效用项集挖掘的准确性。
-
-
-
-
-
-
-
-
-