-
公开(公告)号:CN114429166A
公开(公告)日:2022-05-03
申请号:CN202011182603.X
申请日:2020-10-29
Applicant: 中移动信息技术有限公司 , 中国移动通信集团有限公司
IPC: G06K9/62
Abstract: 本申请提供了一种数据的高维特征获取方法、装置、设备及计算机存储介质。该数据的高维特征获取方法,获取原始数据;对原始数据进行预处理,得到处理后的数据;对处理后的数据进行独热编码,得到第一特征;基于机器学习算法,利用处理后的数据,生成第二特征;将第一特征和第二特征合并,并判断合并后的特征的重要度是否满足预设重要度阈值;在确定满足预设重要度阈值的情况下,复制扩充合并后的特征得到高维特征。根据本申请实施例,能够获取准确率高、特征区分显著的高维特征。
-
公开(公告)号:CN113808755B
公开(公告)日:2024-08-13
申请号:CN202010552673.3
申请日:2020-06-17
Applicant: 中移动信息技术有限公司 , 中国移动通信集团有限公司
IPC: G16H50/80 , G16H50/50 , G06F18/243 , G06F18/27 , G06N20/20 , H04W4/021 , G16Y10/60 , G16Y20/10 , G16Y20/40 , G16Y40/10 , G16Y40/60
Abstract: 本发明实施例公开了一种感染人群预测模型训练的方法、预测的方法、装置、设备。通过获取多个待测用户的特征信息,所述特征信息包括在预设时间段内待测用户处于感染基站覆盖区域的次数,待测用户的年龄,待测用户是否为感染用户的属性信息,待测用户的消费信息中的至少一种;基于所述多个待测用户的特征信息,训练初始模型作为感染人群预测模型。本发明实施例解决了无法及时准确预测感染者的问题,提高了预测感染者的速度和精确度。
-
公开(公告)号:CN116204780A
公开(公告)日:2023-06-02
申请号:CN202111443697.6
申请日:2021-11-30
Applicant: 中移动信息技术有限公司 , 中国移动通信集团有限公司
IPC: G06F18/214 , G06N20/00
Abstract: 本申请提供基于GBDT的集成学习方法、装置、及电子设备,涉及数据挖掘技术领域。所述方法包括:基于梯度提升回归树,将原始特征转换为叶子结节位置,形成数据集;基于数据集,利用滑动窗口,得到衍生特征;对原始特征进行稀疏处理;组合衍生特征和稀疏处理后的原始特征,得到若干训练数据集;基于若干训练数据集,训练得到若干基模型;当需要完成分类任务时,基于若干基模型输出的分类结果,根据预设分类汇总条件,得到最终分类结果。本申请提供的基于GBDT的集成学习方法,能够增加样本的多样性,降低模型偏差,改善集成学习效果;还能够发现特征之间的非线性关系,增加基模型的多样性,避免模型产生高方差,提高模型预测准确率。
-
公开(公告)号:CN114429166B
公开(公告)日:2024-11-15
申请号:CN202011182603.X
申请日:2020-10-29
Applicant: 中移动信息技术有限公司 , 中国移动通信集团有限公司
IPC: G06F18/2113 , G06F18/213 , G06F18/243 , G06F18/10 , G06F18/25 , G06N5/01 , G06N20/20
Abstract: 本申请提供了一种数据的高维特征获取方法、装置、设备及计算机存储介质。该数据的高维特征获取方法,获取原始数据;对原始数据进行预处理,得到处理后的数据;对处理后的数据进行独热编码,得到第一特征;基于机器学习算法,利用处理后的数据,生成第二特征;将第一特征和第二特征合并,并判断合并后的特征的重要度是否满足预设重要度阈值;在确定满足预设重要度阈值的情况下,复制扩充合并后的特征得到高维特征。根据本申请实施例,能够获取准确率高、特征区分显著的高维特征。
-
公开(公告)号:CN113808755A
公开(公告)日:2021-12-17
申请号:CN202010552673.3
申请日:2020-06-17
Applicant: 中移动信息技术有限公司 , 中国移动通信集团有限公司
IPC: G16H50/80 , G16H50/50 , G06K9/62 , G06N20/00 , H04W4/021 , G16Y10/60 , G16Y20/10 , G16Y20/40 , G16Y40/10 , G16Y40/60
Abstract: 本发明实施例公开了一种感染人群预测模型训练的方法、预测的方法、装置、设备。通过获取多个待测用户的特征信息,所述特征信息包括在预设时间段内待测用户处于感染基站覆盖区域的次数,待测用户的年龄,待测用户是否为感染用户的属性信息,待测用户的消费信息中的至少一种;基于所述多个待测用户的特征信息,训练初始模型作为感染人群预测模型。本发明实施例解决了无法及时准确预测感染者的问题,提高了预测感染者的速度和精确度。
-
公开(公告)号:CN116467632A
公开(公告)日:2023-07-21
申请号:CN202310566335.9
申请日:2023-05-18
Applicant: 中移信息技术有限公司 , 中国移动通信集团有限公司
IPC: G06F18/24 , G06F18/25 , G06F18/214
Abstract: 本申请公开了一种训练样本的确定方法、装置、设备及存储介质,涉及通信技术领域。其方法包括:对初始样本集进行分类,得到至少一个用户样本簇,其中,初始用户样本集包括多个用户样本,用户样本包括历史用户的业务数据以及标签;对各用户样本簇进行多次样本融合处理,得到多个融合样本集,其中,各融合样本集包括至少一个融合样本,且不同融合样本集中的融合样本的数量不同,各融合样本包括融合业务数据和融合标签;在各用户样本簇的多个融合样本集中,确定各用户样本簇的目标融合样本集;将至少一个用户样本簇中目标融合样本集的融合样本,确定为目标模型的训练样本,目标模型用于根据用户的业务数据预测用户的所属群体。
-
公开(公告)号:CN115880015A
公开(公告)日:2023-03-31
申请号:CN202111143740.7
申请日:2021-09-28
Applicant: 中移信息技术有限公司 , 中国移动通信集团有限公司
IPC: G06Q30/0601 , G06F18/24 , G06F16/9535
Abstract: 本发明提供一种信息推荐方法及装置。其中,该方法包括:基于枢纽节点联合参与方的数据点,并利用预设密度聚类算子对多域联合数据进行密度聚类分群,得到特征空间差异化的用户群;根据所述用户群的订购产品统计结果,确定预设产品类别对应的初始的偏好用户群分类结果;将所述偏好用户群分类结果输入到相应的模型分类器中基于偏好概率进行产品潜客筛选,得到所述模型分类器输出的目标用户群及其对应的偏好产品类别。采用本发明方法,能够以群为单位进行并行模型预测,根据偏好概率精筛用户,提升了客户分群的准确率和产品推荐效率,为各类别产品细筛出偏好度高的用户群进行精准营销,极大的节省了内部资源,减少获客成本,有效提高了运营效率。
-
公开(公告)号:CN117217780A
公开(公告)日:2023-12-12
申请号:CN202210621908.9
申请日:2022-06-01
Applicant: 中移信息技术有限公司 , 中国移动通信集团有限公司
IPC: G06Q30/0201 , G06Q50/30 , G06N20/20 , G06N5/01
Abstract: 本发明提供一种业务指标筛选方法及移动通信业务回退潜客识别方法,首先获取样本用户对应于目标业务的各业务指标的样本指标数据;然后基于各业务指标的样本指标数据,确定各业务指标的信息价值以及各业务指标之间的相关性;最后通过各业务指标的信息价值以及各业务指标之间的相关性,对各业务指标进行筛选。该方法不需要引入人工操作,相比于业务人员人工选取业务指标的方法,不仅可以实现对业务指标的准确筛选,使得保留下来的业务指标更加合理,也降低了业务指标的应用出现偏差的可能性。同时,还可以节约人力成本。
-
公开(公告)号:CN113052198B
公开(公告)日:2024-06-21
申请号:CN201911384128.1
申请日:2019-12-28
Applicant: 中移信息技术有限公司 , 中国移动通信集团有限公司
IPC: G06F18/2413 , G06F18/2431 , G06F18/2321 , G06N5/01
Abstract: 本发明实施例公开了一种数据处理方法、装置、设备及存储介质,该方法包括:获取第一样本集中非数值型和/或离散型的字段数据;对字段数据进行降维,得到与第一样本集相关的边界样本集;根据第一样本集中每个样本的概率值,确定随机样本的至少一个近邻样本;基于至少一个近邻样本和边界样本集,生成包括少数类样本的第二样本集。能够解决在保证整体分类准确度稳定的前提下,提高少数类样本集分类的准确性的问题。
-
公开(公告)号:CN115983453A
公开(公告)日:2023-04-18
申请号:CN202211638536.7
申请日:2022-12-19
Applicant: 中移信息技术有限公司 , 中国移动通信集团有限公司
IPC: G06Q10/04 , G06Q10/0639 , G06F17/14 , G06F17/18 , G06F40/18
Abstract: 本申请实施例提供了一种报表指标的预测方法、装置、设备及存储介质,预测方法包括:根据第一报表的第一指标在多个历史时刻的历史数据、随时间发展的趋势关系、周期性信息、当前时刻与目标先前时刻之间的节假日信息、与第一指标具有相同业务维度的第二指标在当前时刻的真实数据以及第二报表的第一指标在当前时刻的真实数据和预测数据,确定第一指标在当前时刻的趋势值、周期值、节假日波动值、业务相关性取值以及修正值;将趋势值、周期值、节假日波动值、业务相关性取值以及修正值输入至指标预测模型,得到第一报表的第一指标在当前时刻的预测值。根据本申请实施例,能够从五个维度实现对报表指标的精准预测。
-
-
-
-
-
-
-
-
-