-
公开(公告)号:CN112884501B
公开(公告)日:2023-10-10
申请号:CN201911207323.7
申请日:2019-11-29
Applicant: 百度在线网络技术(北京)有限公司
IPC: G06Q30/0202 , G06Q30/0241 , G06N20/00
Abstract: 本申请公开了一种数据处理方法、装置、电子设备及存储介质,涉及机器学习模型的处理技术领域。具体实现方案为:获取目标用户使用的任务模型的训练状态;根据训练状态将目标用户划分到目标任务,目标任务为多任务学习模型中的一个任务,多任务学习模型配置有与训练状态匹配的任务;使用任务对目标用户进行预测。本申请实施例提供的数据处理方案,能够获取单任务模型对于目标用户的训练状态。多任务模型中根据不同的训练状态配置有不同的任务,根据训练状态将目标用户划分到相应的目标任务中,由目标任务对目标用户进行预测,进而使用与目标用户匹配度更高的目标任务对目标用户进行预测,能够更加准确的预测转化率,优化转化率的预测效果。
-
公开(公告)号:CN112801682A
公开(公告)日:2021-05-14
申请号:CN201911112654.2
申请日:2019-11-14
Applicant: 百度在线网络技术(北京)有限公司
Abstract: 本申请实施例公开了一种数据修正方法、装置、设备和存储介质,涉及大数据技术领域。具体实现方案为:根据已更新样本数据进行训练,得到稳定预测模型;根据未更新样本数据,从稳定预测模型中选择锚点预测模型;根据锚点预测模型对已更新样本数据和未更新样本数据进行预测,分别得到已更新预测结果和未更新预测结果;根据已更新预测结果和未更新预测结果,对未更新样本数据进行修正,用于采用修正后的未更新样本数据进行预测模型的训练。通过以相对完整的已更新样本数据对非完整的未更新样本数据进行修正,保证了样本数据在未达到转化周期而不完整的情况仍然能够参与模型的训练,提高了模型训练的时效性,同时保障了训练模型的准确率。
-
公开(公告)号:CN112541145B
公开(公告)日:2023-10-17
申请号:CN201910893817.9
申请日:2019-09-20
Applicant: 百度在线网络技术(北京)有限公司
IPC: G06F16/958 , G06Q30/0241 , G06Q30/0242
Abstract: 本申请公开了一种页面展现方法、装置、设备及存储介质,涉及大数据领域。具体实现方案为:获取多个备选的展现页面,所述展现页面与第一类展现转化和至少一个第二类展现转化关联,第二类展现转化概率高于第一类展现转化概率;根据与所述第一类展现转化匹配的第一类历史展现页面,以及与所述第二类展现转化匹配的第二类历史展现页面,对各所述备选的展现页面的第一类展现转化概率进行预测;根据预测结果,在所述多个备选的展现页面中获取至少一个目标页面,并对所述至少一个目标页面进行展示。本申请实施例的技术方案可以在深层转化正样本数量较少的情况下,提高深层转化概率预估的准确性。
-
公开(公告)号:CN112818291B
公开(公告)日:2023-09-01
申请号:CN201911130006.X
申请日:2019-11-18
Applicant: 百度在线网络技术(北京)有限公司
IPC: G06Q30/0202 , G06Q30/0242 , G06F17/18 , G06N3/084
Abstract: 本申请实施例公开了一种转化率预测方法、装置、设备和介质,涉及大数据技术领域。具体实现方案为:若检测到新增候选对象,则基于多任务模型中的通用子模型,确定所述新增候选对象的模型收敛时长;根据所述新增候选对象的模型收敛时长,从所述多任务模型中确定目标区间子模型;基于所述目标区间子模型,对所述新增候选对象进行转化率预测。因为采用了由通用子模型过度至区间子模型进行转化率预测的技术手段,新增候选对象可以自动从粗粒度通用预测过度到区间子模型的精确预测,促进了模型的适用范围自动化推广,提高了转化率预测的准确率。
-
公开(公告)号:CN112822302B
公开(公告)日:2023-03-24
申请号:CN201911127228.6
申请日:2019-11-18
Applicant: 百度在线网络技术(北京)有限公司
IPC: H04L61/301 , H04L61/4511
Abstract: 本申请公开了数据归一化的方法、装置、电子设备及存储介质,涉及数据处理领域,尤其是网络地址归一化处理技术领域。具体实现方案为:获取多个规则词表,多个规则词表由离线模块生成,多个规则词表分别记录不同作用范围的正则表达式;获取目标网络地址;根据多个规则词表,按照记录的正则表达式的作用范围由大至小的顺序,依次对网络地址进行字符匹配,得到归一化网络地址。依次使用多个规则对目标网络地址进行正则表达式的匹配,提高了网络地址归一化处理的准确性。在线模块无需进行规则词表的生成,因此在线模块能够不间断的对获取到的目标地址进行归一化处理,提高了网络地址归一化处理效率。
-
公开(公告)号:CN112819497B
公开(公告)日:2023-10-10
申请号:CN201911128977.0
申请日:2019-11-18
Applicant: 百度在线网络技术(北京)有限公司
IPC: G06Q30/0242 , G06N3/08
Abstract: 本申请实施例公开一种转化率预测方法、装置、设备和存储介质,涉及大数据技术领域。具体实现方案为:获取待预测用户数据,以及待预测媒介信息;根据待预测媒介信息所属的投放方,在多任务模型中确定投放方关联的目标子模型;其中,多任务模型中的子模型是基于样本数据的场景信息训练得到,目标子模型是基于子模型对于投放方的预测结果确定的;基于目标子模型,根据待预测用户数据和待预测媒介信息,得到待预测用户对待预测媒介信息的转化率。本申请实施例通过采用多任务模型来预测用户对媒介信息的转化率,避免单任务模型中无法进行多层面的特征学习,充分考虑媒介信息在各场景维度下的场景特征,提高多任务模型进行转化率预测的准确率。
-
公开(公告)号:CN112884501A
公开(公告)日:2021-06-01
申请号:CN201911207323.7
申请日:2019-11-29
Applicant: 百度在线网络技术(北京)有限公司
Abstract: 本申请公开了一种数据处理方法、装置、电子设备及存储介质,涉及机器学习模型的处理技术领域。具体实现方案为:获取目标用户使用的任务模型的训练状态;根据训练状态将目标用户划分到目标任务,目标任务为多任务学习模型中的一个任务,多任务学习模型配置有与训练状态匹配的任务;使用任务对目标用户进行预测。本申请实施例提供的数据处理方案,能够获取单任务模型对于目标用户的训练状态。多任务模型中根据不同的训练状态配置有不同的任务,根据训练状态将目标用户划分到相应的目标任务中,由目标任务对目标用户进行预测,进而使用与目标用户匹配度更高的目标任务对目标用户进行预测,能够更加准确的预测转化率,优化转化率的预测效果。
-
公开(公告)号:CN112822302A
公开(公告)日:2021-05-18
申请号:CN201911127228.6
申请日:2019-11-18
Applicant: 百度在线网络技术(北京)有限公司
IPC: H04L29/12
Abstract: 本申请公开了数据归一化的方法、装置、电子设备及存储介质,涉及数据处理领域,尤其是网络地址归一化处理技术领域。具体实现方案为:获取多个规则词表,多个规则词表由离线模块生成,多个规则词表分别记录不同作用范围的正则表达式;获取目标网络地址;根据多个规则词表,按照记录的正则表达式的作用范围由大至小的顺序,依次对网络地址进行字符匹配,得到归一化网络地址。依次使用多个规则对目标网络地址进行正则表达式的匹配,提高了网络地址归一化处理的准确性。在线模块无需进行规则词表的生成,因此在线模块能够不间断的对获取到的目标地址进行归一化处理,提高了网络地址归一化处理效率。
-
公开(公告)号:CN112819498B
公开(公告)日:2023-10-17
申请号:CN201911130009.3
申请日:2019-11-18
Applicant: 百度在线网络技术(北京)有限公司
IPC: G06Q30/0242 , G06Q30/0241
Abstract: 本申请公开了一种转化率确定方法、装置、电子设备和存储介质,涉及人工智能技术领域。具体实现方案为:基于多任务模型中特征表示网络层,根据待预测用户数据和待预测媒介信息生成用户媒介特征表示;基于多任务模型中的通用模型,根据用户媒介特征表示确定待预测用户对待预测媒介信息的转化率;其中,多任务模型包括所述通用模型以及至少两个区间模型,不同区间模型关联有不同转化率区间,且通用模型与至少两个区间模型共享特征表示网络层。本申请实施例的多任务模型中包括通用模型及关联有不同转化率区间的区间模型,使得训练完的特征表示网络层可以准确全面的提取数据的特征表示,提高多任务模型的泛化能力,进而提高转化率预估的准确性。
-
公开(公告)号:CN112801682B
公开(公告)日:2023-10-17
申请号:CN201911112654.2
申请日:2019-11-14
Applicant: 百度在线网络技术(北京)有限公司
IPC: G06Q30/0242 , G06Q10/04
Abstract: 本申请实施例公开了一种数据修正方法、装置、设备和存储介质,涉及大数据技术领域。具体实现方案为:根据已更新样本数据进行训练,得到稳定预测模型;根据未更新样本数据,从稳定预测模型中选择锚点预测模型;根据锚点预测模型对已更新样本数据和未更新样本数据进行预测,分别得到已更新预测结果和未更新预测结果;根据已更新预测结果和未更新预测结果,对未更新样本数据进行修正,用于采用修正后的未更新样本数据进行预测模型的训练。通过以相对完整的已更新样本数据对非完整的未更新样本数据进行修正,保证了样本数据在未达到转化周期而不完整的情况仍然能够参与模型的训练,提高了模型训练的时效性,同时保障了训练模型的准确率。
-
-
-
-
-
-
-
-
-