项集挖掘方法及装置
    1.
    发明公开

    公开(公告)号:CN106033447A

    公开(公告)日:2016-10-19

    申请号:CN201510115234.5

    申请日:2015-03-16

    Abstract: 本发明公开了一种项集挖掘方法及装置,属于数据挖掘领域。所述方法包括:获取自定义的最小期望支持度μ和最低效用比例ε;计算不确定性数据库D中项集的实际期望支持度expSup和实际效用值u,该项集中包含至少一个数据项;当expSup≥|D|*μ,且u≥总效用值TU*ε时,确定该项集为高概率且高效用项集;TU表示不确定性数据库D中所有数据项的效用之和;|D|表示不确定性数据库D中包含的事务总数。本发明达到了挖掘出的项集效用值较高,且发生概率较大,从而保证挖掘出的项集具有较高的实际使用价值的效果。

    数据挖掘方法和装置
    2.
    发明公开

    公开(公告)号:CN106033424A

    公开(公告)日:2016-10-19

    申请号:CN201510106336.0

    申请日:2015-03-11

    Abstract: 本发明公开了一种数据挖掘方法和装置,属于数据挖掘领域。方法包括:扫描事务数据库,得到多个事务以及至少一个项目;获取多个候选项集;对于每个候选项集,根据候选项集中每个项目的权重以及包括候选项集的指定事务的数目,计算候选项集的加权支持度;根据每个指定事务的发生时间,计算候选项集的时效值;判断候选项集的时效值是否大于第一阈值,以及加权支持度是否大于第二阈值;当时效值大于第一阈值且加权支持度大于第二阈值时,将候选项集确定为近期高权重频繁项集。本发明考虑到项集的时效性因素,降低了出现干扰的可能性,且挖掘出的近期高权重频繁项集中的项目之间的关联规则可以准确体现近期的关联规则,提高了准确性和实用性。

    一种对象信息的展示方法和装置

    公开(公告)号:CN106033576B

    公开(公告)日:2020-08-11

    申请号:CN201510106783.6

    申请日:2015-03-11

    Abstract: 本发明公开了一种对象信息的展示方法和装置,属于互联网技术领域。所述方法包括:获取目标店铺中各对象对应的利润值,以及当前时间点之前预设时长的历史时段内所述各对象的交易数量;根据所述各对象对应的利润值和所述各对象的交易数量,在所述各对象中,选取在所述历史时段内的累计利润值满足预设的利润值条件的对象,作为待展示对象;对所述待展示对象的对象信息进行展示。采用本发明,可以提高展示对象信息的灵活性。

    项集挖掘方法及装置
    4.
    发明授权

    公开(公告)号:CN106033447B

    公开(公告)日:2020-04-21

    申请号:CN201510115234.5

    申请日:2015-03-16

    Abstract: 本发明公开了一种项集挖掘方法及装置,属于数据挖掘领域。所述方法包括:获取自定义的最小期望支持度μ和最低效用比例ε;计算不确定性数据库D中项集的实际期望支持度expSup和实际效用值u,该项集中包含至少一个数据项;当expSup≥|D|*μ,且u≥总效用值TU*ε时,确定该项集为高概率且高效用项集;TU表示不确定性数据库D中所有数据项的效用之和;|D|表示不确定性数据库D中包含的事务总数。本发明达到了挖掘出的项集效用值较高,且发生概率较大,从而保证挖掘出的项集具有较高的实际使用价值的效果。

    数据挖掘方法和装置
    5.
    发明授权

    公开(公告)号:CN106033424B

    公开(公告)日:2020-04-21

    申请号:CN201510106336.0

    申请日:2015-03-11

    Abstract: 本发明公开了一种数据挖掘方法和装置,属于数据挖掘领域。方法包括:扫描事务数据库,得到多个事务以及至少一个项目;获取多个候选项集;对于每个候选项集,根据候选项集中每个项目的权重以及包括候选项集的指定事务的数目,计算候选项集的加权支持度;根据每个指定事务的发生时间,计算候选项集的时效值;判断候选项集的时效值是否大于第一阈值,以及加权支持度是否大于第二阈值;当时效值大于第一阈值且加权支持度大于第二阈值时,将候选项集确定为近期高权重频繁项集。本发明考虑到项集的时效性因素,降低了出现干扰的可能性,且挖掘出的近期高权重频繁项集中的项目之间的关联规则可以准确体现近期的关联规则,提高了准确性和实用性。

    一种对象信息的展示方法和装置

    公开(公告)号:CN106033576A

    公开(公告)日:2016-10-19

    申请号:CN201510106783.6

    申请日:2015-03-11

    Abstract: 本发明公开了一种对象信息的展示方法和装置,属于互联网技术领域。所述方法包括:获取目标店铺中各对象对应的利润值,以及当前时间点之前预设时长的历史时段内所述各对象的交易数量;根据所述各对象对应的利润值和所述各对象的交易数量,在所述各对象中,选取在所述历史时段内的累计利润值满足预设的利润值条件的对象,作为待展示对象;对所述待展示对象的对象信息进行展示。采用本发明,可以提高展示对象信息的灵活性。

    数据采集方法、装置、电子设备及存储介质

    公开(公告)号:CN118132530A

    公开(公告)日:2024-06-04

    申请号:CN202211539723.X

    申请日:2022-12-02

    Abstract: 本申请涉及大数据技术领域,公开了一种数据采集方法、装置、电子设备及存储介质,该方法包括:若业务系统中需要采集的租户数据库的结构发生变更,获取租户数据库的变更信息,变更信息指示了变更后需要进行数据采集的源数据表和源数据表中需要进行数据采集的第一字段;根据源数据表中的第一字段和第一字段在源数据表中的字段类型,生成源数据表对应的目的表,第一字段在源数据表中的字段类型与第一字段在目的表中的字段类型相同;获取任务分配信息;控制多个节点并行执行所对应的采集任务,以并行从多个源数据表中采集数据,并将所采集到的数据写入与所来源的源数据表对应的目的表中;本申请可以提升数据采集效率。

    数据离散化的方法及装置
    8.
    发明公开

    公开(公告)号:CN106296245A

    公开(公告)日:2017-01-04

    申请号:CN201510271649.1

    申请日:2015-05-25

    Abstract: 本发明实施例公开了一种数据离散化方法,包括:接收输入的有序排列的样本集,获取预设的有序排列的初始离散格式;获取预设的类别集合,遍历所述获取到的类别集合中的类别值,获取所述样本集在遍历到的类别值下的在所述初始离散格式中的起始阈值到每个阈值的积分区间的第一样本数,生成积分矩阵;迭代获取所述初始离散格式中的阈值集合的子集,查找所述遍历到的子集中的两两相邻的阈值构成的取值区间,根据所述积分矩阵获取所述每个查找到的取值区间对应的在每个类别值下的第二样本数和在所有类别值下的第三样本数,根据积分矩阵、所述取值区间对应的第二样本数和第三样本数以及所述类别集合计算所述遍历到的子集对应的区分度;查找区分度最大的子集,将所述查找到的区分度最大的子集作为目标离散格式输出。本发明还公开了一种数据离散化装置。本发明中数据离散化方法及装置可以减少计算复杂度,提高执行效率。

    数据离散化的方法及装置
    9.
    发明公开

    公开(公告)号:CN106296244A

    公开(公告)日:2017-01-04

    申请号:CN201510271647.2

    申请日:2015-05-25

    Abstract: 本发明实施例公开了一种数据离散化方法,包括:接收输入的有序排列的样本集,获取预设的有序排列的初始离散格式;获取预设的类别集合,遍历所述获取到的类别集合中的类别值,获取所述样本集在遍历到的类别值下的在所述初始离散格式中的起始阈值到每个阈值的积分区间的第一样本数,生成积分矩阵;根据所述积分矩阵计算初始离散格式中各个阈值构成的取值区间的区分度;迭代查找区分度最大且不为预设的特征值的取值区间,将所述区分度最大的取值区间对应的阈值添加到目标离散格式中,并将所述区分度最大的取值区间中包含的各个子区间对应的区分度设为所述特征值,直至所有取值区间的区分度均为所述特征值,输出所述目标离散格式。本发明还公开了一种数据离散化装置。本发明中数据离散化方法及装置可以减少计算复杂度,提高执行效率。

    视频转码方法、装置、服务器及存储介质

    公开(公告)号:CN118803304A

    公开(公告)日:2024-10-18

    申请号:CN202310427279.0

    申请日:2023-04-12

    Abstract: 本申请实施例公开了一种视频转码方法、装置、服务器及存储介质,涉及云技术领域。包括:在视频文件具有转码需求的情况下,基于排队策略将视频文件添加至转码队列,转码队列中不同队列位置对应不同转码优先级,排队策略指用于确定视频文件所处队列位置的策略;接收视频处理节点的参数获取请求,参数获取请求中包含从转码队列中获取的待转码文件的视频信息;基于视频信息,确定待转码文件的转码参数;向视频处理节点发送转码参数,以便视频处理节点基于转码参数对待转码文件进行转码。本申请实施例中,重要程度较高的视频文件能被优先转码,且不同的视频文件能基于不同的转码参数进行针对性转码,提升了视频转码效率。

Patent Agency Ranking