数据的高维特征获取方法、装置、设备及计算机存储介质

    公开(公告)号:CN114429166A

    公开(公告)日:2022-05-03

    申请号:CN202011182603.X

    申请日:2020-10-29

    Abstract: 本申请提供了一种数据的高维特征获取方法、装置、设备及计算机存储介质。该数据的高维特征获取方法,获取原始数据;对原始数据进行预处理,得到处理后的数据;对处理后的数据进行独热编码,得到第一特征;基于机器学习算法,利用处理后的数据,生成第二特征;将第一特征和第二特征合并,并判断合并后的特征的重要度是否满足预设重要度阈值;在确定满足预设重要度阈值的情况下,复制扩充合并后的特征得到高维特征。根据本申请实施例,能够获取准确率高、特征区分显著的高维特征。

    基于GBDT的集成学习方法、装置、及电子设备

    公开(公告)号:CN116204780A

    公开(公告)日:2023-06-02

    申请号:CN202111443697.6

    申请日:2021-11-30

    Abstract: 本申请提供基于GBDT的集成学习方法、装置、及电子设备,涉及数据挖掘技术领域。所述方法包括:基于梯度提升回归树,将原始特征转换为叶子结节位置,形成数据集;基于数据集,利用滑动窗口,得到衍生特征;对原始特征进行稀疏处理;组合衍生特征和稀疏处理后的原始特征,得到若干训练数据集;基于若干训练数据集,训练得到若干基模型;当需要完成分类任务时,基于若干基模型输出的分类结果,根据预设分类汇总条件,得到最终分类结果。本申请提供的基于GBDT的集成学习方法,能够增加样本的多样性,降低模型偏差,改善集成学习效果;还能够发现特征之间的非线性关系,增加基模型的多样性,避免模型产生高方差,提高模型预测准确率。

    训练样本的确定方法、装置、设备及存储介质

    公开(公告)号:CN116467632A

    公开(公告)日:2023-07-21

    申请号:CN202310566335.9

    申请日:2023-05-18

    Abstract: 本申请公开了一种训练样本的确定方法、装置、设备及存储介质,涉及通信技术领域。其方法包括:对初始样本集进行分类,得到至少一个用户样本簇,其中,初始用户样本集包括多个用户样本,用户样本包括历史用户的业务数据以及标签;对各用户样本簇进行多次样本融合处理,得到多个融合样本集,其中,各融合样本集包括至少一个融合样本,且不同融合样本集中的融合样本的数量不同,各融合样本包括融合业务数据和融合标签;在各用户样本簇的多个融合样本集中,确定各用户样本簇的目标融合样本集;将至少一个用户样本簇中目标融合样本集的融合样本,确定为目标模型的训练样本,目标模型用于根据用户的业务数据预测用户的所属群体。

    一种信息推荐方法及装置
    7.
    发明公开

    公开(公告)号:CN115880015A

    公开(公告)日:2023-03-31

    申请号:CN202111143740.7

    申请日:2021-09-28

    Abstract: 本发明提供一种信息推荐方法及装置。其中,该方法包括:基于枢纽节点联合参与方的数据点,并利用预设密度聚类算子对多域联合数据进行密度聚类分群,得到特征空间差异化的用户群;根据所述用户群的订购产品统计结果,确定预设产品类别对应的初始的偏好用户群分类结果;将所述偏好用户群分类结果输入到相应的模型分类器中基于偏好概率进行产品潜客筛选,得到所述模型分类器输出的目标用户群及其对应的偏好产品类别。采用本发明方法,能够以群为单位进行并行模型预测,根据偏好概率精筛用户,提升了客户分群的准确率和产品推荐效率,为各类别产品细筛出偏好度高的用户群进行精准营销,极大的节省了内部资源,减少获客成本,有效提高了运营效率。

    报表指标的预测方法、装置、设备及存储介质

    公开(公告)号:CN115983453A

    公开(公告)日:2023-04-18

    申请号:CN202211638536.7

    申请日:2022-12-19

    Abstract: 本申请实施例提供了一种报表指标的预测方法、装置、设备及存储介质,预测方法包括:根据第一报表的第一指标在多个历史时刻的历史数据、随时间发展的趋势关系、周期性信息、当前时刻与目标先前时刻之间的节假日信息、与第一指标具有相同业务维度的第二指标在当前时刻的真实数据以及第二报表的第一指标在当前时刻的真实数据和预测数据,确定第一指标在当前时刻的趋势值、周期值、节假日波动值、业务相关性取值以及修正值;将趋势值、周期值、节假日波动值、业务相关性取值以及修正值输入至指标预测模型,得到第一报表的第一指标在当前时刻的预测值。根据本申请实施例,能够从五个维度实现对报表指标的精准预测。

Patent Agency Ranking