-
公开(公告)号:CN116204780A
公开(公告)日:2023-06-02
申请号:CN202111443697.6
申请日:2021-11-30
Applicant: 中移动信息技术有限公司 , 中国移动通信集团有限公司
IPC: G06F18/214 , G06N20/00
Abstract: 本申请提供基于GBDT的集成学习方法、装置、及电子设备,涉及数据挖掘技术领域。所述方法包括:基于梯度提升回归树,将原始特征转换为叶子结节位置,形成数据集;基于数据集,利用滑动窗口,得到衍生特征;对原始特征进行稀疏处理;组合衍生特征和稀疏处理后的原始特征,得到若干训练数据集;基于若干训练数据集,训练得到若干基模型;当需要完成分类任务时,基于若干基模型输出的分类结果,根据预设分类汇总条件,得到最终分类结果。本申请提供的基于GBDT的集成学习方法,能够增加样本的多样性,降低模型偏差,改善集成学习效果;还能够发现特征之间的非线性关系,增加基模型的多样性,避免模型产生高方差,提高模型预测准确率。
-
公开(公告)号:CN114429166B
公开(公告)日:2024-11-15
申请号:CN202011182603.X
申请日:2020-10-29
Applicant: 中移动信息技术有限公司 , 中国移动通信集团有限公司
IPC: G06F18/2113 , G06F18/213 , G06F18/243 , G06F18/10 , G06F18/25 , G06N5/01 , G06N20/20
Abstract: 本申请提供了一种数据的高维特征获取方法、装置、设备及计算机存储介质。该数据的高维特征获取方法,获取原始数据;对原始数据进行预处理,得到处理后的数据;对处理后的数据进行独热编码,得到第一特征;基于机器学习算法,利用处理后的数据,生成第二特征;将第一特征和第二特征合并,并判断合并后的特征的重要度是否满足预设重要度阈值;在确定满足预设重要度阈值的情况下,复制扩充合并后的特征得到高维特征。根据本申请实施例,能够获取准确率高、特征区分显著的高维特征。
-
公开(公告)号:CN113808755A
公开(公告)日:2021-12-17
申请号:CN202010552673.3
申请日:2020-06-17
Applicant: 中移动信息技术有限公司 , 中国移动通信集团有限公司
IPC: G16H50/80 , G16H50/50 , G06K9/62 , G06N20/00 , H04W4/021 , G16Y10/60 , G16Y20/10 , G16Y20/40 , G16Y40/10 , G16Y40/60
Abstract: 本发明实施例公开了一种感染人群预测模型训练的方法、预测的方法、装置、设备。通过获取多个待测用户的特征信息,所述特征信息包括在预设时间段内待测用户处于感染基站覆盖区域的次数,待测用户的年龄,待测用户是否为感染用户的属性信息,待测用户的消费信息中的至少一种;基于所述多个待测用户的特征信息,训练初始模型作为感染人群预测模型。本发明实施例解决了无法及时准确预测感染者的问题,提高了预测感染者的速度和精确度。
-
公开(公告)号:CN113808755B
公开(公告)日:2024-08-13
申请号:CN202010552673.3
申请日:2020-06-17
Applicant: 中移动信息技术有限公司 , 中国移动通信集团有限公司
IPC: G16H50/80 , G16H50/50 , G06F18/243 , G06F18/27 , G06N20/20 , H04W4/021 , G16Y10/60 , G16Y20/10 , G16Y20/40 , G16Y40/10 , G16Y40/60
Abstract: 本发明实施例公开了一种感染人群预测模型训练的方法、预测的方法、装置、设备。通过获取多个待测用户的特征信息,所述特征信息包括在预设时间段内待测用户处于感染基站覆盖区域的次数,待测用户的年龄,待测用户是否为感染用户的属性信息,待测用户的消费信息中的至少一种;基于所述多个待测用户的特征信息,训练初始模型作为感染人群预测模型。本发明实施例解决了无法及时准确预测感染者的问题,提高了预测感染者的速度和精确度。
-
公开(公告)号:CN114429166A
公开(公告)日:2022-05-03
申请号:CN202011182603.X
申请日:2020-10-29
Applicant: 中移动信息技术有限公司 , 中国移动通信集团有限公司
IPC: G06K9/62
Abstract: 本申请提供了一种数据的高维特征获取方法、装置、设备及计算机存储介质。该数据的高维特征获取方法,获取原始数据;对原始数据进行预处理,得到处理后的数据;对处理后的数据进行独热编码,得到第一特征;基于机器学习算法,利用处理后的数据,生成第二特征;将第一特征和第二特征合并,并判断合并后的特征的重要度是否满足预设重要度阈值;在确定满足预设重要度阈值的情况下,复制扩充合并后的特征得到高维特征。根据本申请实施例,能够获取准确率高、特征区分显著的高维特征。
-
公开(公告)号:CN114463121B
公开(公告)日:2024-12-31
申请号:CN202011246191.1
申请日:2020-11-10
Applicant: 中移物联网有限公司 , 中国移动通信集团有限公司
Abstract: 本发明的实施例提供一种基于区块链的交易信息处理方法、装置和电子设备,应用于区块链中的发起节点的方法包括:接收交易提案;根据本地账本数据,对所述交易提案的提案类型进行确认;在确认所述交易提案的提案类型为可验证交易的情况下,将所述交易提案发送至所述区块链中的排序节点。本发明的方案可以提高区块链对交易信息的处理性能。
-
公开(公告)号:CN113052198B
公开(公告)日:2024-06-21
申请号:CN201911384128.1
申请日:2019-12-28
Applicant: 中移信息技术有限公司 , 中国移动通信集团有限公司
IPC: G06F18/2413 , G06F18/2431 , G06F18/2321 , G06N5/01
Abstract: 本发明实施例公开了一种数据处理方法、装置、设备及存储介质,该方法包括:获取第一样本集中非数值型和/或离散型的字段数据;对字段数据进行降维,得到与第一样本集相关的边界样本集;根据第一样本集中每个样本的概率值,确定随机样本的至少一个近邻样本;基于至少一个近邻样本和边界样本集,生成包括少数类样本的第二样本集。能够解决在保证整体分类准确度稳定的前提下,提高少数类样本集分类的准确性的问题。
-
公开(公告)号:CN117314553A
公开(公告)日:2023-12-29
申请号:CN202311191654.2
申请日:2023-09-14
Applicant: 中移信息技术有限公司 , 中国移动通信集团有限公司
IPC: G06Q30/0601 , G06Q30/0202 , G06Q40/08 , G06F18/25 , G06F18/22 , G06N3/0455 , G06N3/0499 , G06N3/084
Abstract: 本发明公开了一种数据处理方法、装置、设备及存储介质,属于产品推荐技术领域。本发明获取当前信令数据和当前用户属性数据;将当前信令数据进行融合,得到时空统计特征数据;将当前用户属性数据按照预设编码策略映射为统一维度的目标用户基础属性特征;基于时空统计特征数据计算各统计特征的相似度,并根据计算结果得到目标时空信息特征;将目标时空信息特征和目标用户基础属性特征输入至成功率预测模型,得到用户属性;根据用户属性进行产品推荐,成功率预测模型为解码器结构更新后的结构,可以提取到不同模态特征深层的联系,从而更有效的对特征进行融合和提取,适用多种产品推荐场景,提高产品推荐的效果。
-
公开(公告)号:CN116645221A
公开(公告)日:2023-08-25
申请号:CN202211585558.1
申请日:2022-12-09
Applicant: 中移信息技术有限公司 , 中国移动通信集团有限公司
IPC: G06Q40/08 , G06F18/23 , G06F18/213 , G06F18/24 , G06N3/006
Abstract: 本申请实施例公开了一种风险评估方法及装置、设备和存储介质,其中,所述方法包括:获取待评估对象的当前用户数据;确定所述当前用户数据对应的目标样本类别;从多个已训练的风险评估模型中,确定与所述目标样本类别匹配的目标风险评估模型;其中,不同的所述风险评估模型对应不同的样本类别,并通过对应样本类别下的历史用户数据训练得到;基于所述当前用户数据和所述目标风险评估模型,确定所述待评估对象的当前风险等级。
-
公开(公告)号:CN115952468A
公开(公告)日:2023-04-11
申请号:CN202211646017.5
申请日:2022-12-20
Applicant: 中移信息技术有限公司 , 中国移动通信集团有限公司
IPC: G06F18/25 , G06F18/214 , G06F18/2431 , G06Q40/08 , G06Q10/04
Abstract: 本申请公开了一种特征处理方法、装置、设备及计算机存储介质,涉及大数据技术领域。该方法包括:获取样本数据集,所述样本数据集中包括N个用户样本一一对应的目标信息,所述目标信息包括样本标签和在M个特征下分别对应的M个特征标签;基于所述N个用户样本一一对应的目标信息,采用catboost算法对所述样本数据集中的M个特征进行特征交叉,得到Q个混合特征,所述Q个混合特征用于作为目标预测模型的输入特征;其中,所述Q个混合特征中任一混合特征中包括的特征的数量小于或者等于预设阈值。根据本申请实施例,能够直接对样本特征进行特征衍生,从而有效避免了高维稀疏特征的出现。
-
-
-
-
-
-
-
-
-