数据处理方法、装置、电子设备及存储介质

    公开(公告)号:CN112884501B

    公开(公告)日:2023-10-10

    申请号:CN201911207323.7

    申请日:2019-11-29

    Abstract: 本申请公开了一种数据处理方法、装置、电子设备及存储介质,涉及机器学习模型的处理技术领域。具体实现方案为:获取目标用户使用的任务模型的训练状态;根据训练状态将目标用户划分到目标任务,目标任务为多任务学习模型中的一个任务,多任务学习模型配置有与训练状态匹配的任务;使用任务对目标用户进行预测。本申请实施例提供的数据处理方案,能够获取单任务模型对于目标用户的训练状态。多任务模型中根据不同的训练状态配置有不同的任务,根据训练状态将目标用户划分到相应的目标任务中,由目标任务对目标用户进行预测,进而使用与目标用户匹配度更高的目标任务对目标用户进行预测,能够更加准确的预测转化率,优化转化率的预测效果。

    数据修正方法、装置、设备和存储介质

    公开(公告)号:CN112801682A

    公开(公告)日:2021-05-14

    申请号:CN201911112654.2

    申请日:2019-11-14

    Abstract: 本申请实施例公开了一种数据修正方法、装置、设备和存储介质,涉及大数据技术领域。具体实现方案为:根据已更新样本数据进行训练,得到稳定预测模型;根据未更新样本数据,从稳定预测模型中选择锚点预测模型;根据锚点预测模型对已更新样本数据和未更新样本数据进行预测,分别得到已更新预测结果和未更新预测结果;根据已更新预测结果和未更新预测结果,对未更新样本数据进行修正,用于采用修正后的未更新样本数据进行预测模型的训练。通过以相对完整的已更新样本数据对非完整的未更新样本数据进行修正,保证了样本数据在未达到转化周期而不完整的情况仍然能够参与模型的训练,提高了模型训练的时效性,同时保障了训练模型的准确率。

    数据归一化的方法、装置、电子设备及存储介质

    公开(公告)号:CN112822302B

    公开(公告)日:2023-03-24

    申请号:CN201911127228.6

    申请日:2019-11-18

    Abstract: 本申请公开了数据归一化的方法、装置、电子设备及存储介质,涉及数据处理领域,尤其是网络地址归一化处理技术领域。具体实现方案为:获取多个规则词表,多个规则词表由离线模块生成,多个规则词表分别记录不同作用范围的正则表达式;获取目标网络地址;根据多个规则词表,按照记录的正则表达式的作用范围由大至小的顺序,依次对网络地址进行字符匹配,得到归一化网络地址。依次使用多个规则对目标网络地址进行正则表达式的匹配,提高了网络地址归一化处理的准确性。在线模块无需进行规则词表的生成,因此在线模块能够不间断的对获取到的目标地址进行归一化处理,提高了网络地址归一化处理效率。

    转化率预测方法、装置、设备和存储介质

    公开(公告)号:CN112819497B

    公开(公告)日:2023-10-10

    申请号:CN201911128977.0

    申请日:2019-11-18

    Abstract: 本申请实施例公开一种转化率预测方法、装置、设备和存储介质,涉及大数据技术领域。具体实现方案为:获取待预测用户数据,以及待预测媒介信息;根据待预测媒介信息所属的投放方,在多任务模型中确定投放方关联的目标子模型;其中,多任务模型中的子模型是基于样本数据的场景信息训练得到,目标子模型是基于子模型对于投放方的预测结果确定的;基于目标子模型,根据待预测用户数据和待预测媒介信息,得到待预测用户对待预测媒介信息的转化率。本申请实施例通过采用多任务模型来预测用户对媒介信息的转化率,避免单任务模型中无法进行多层面的特征学习,充分考虑媒介信息在各场景维度下的场景特征,提高多任务模型进行转化率预测的准确率。

    数据处理方法、装置、电子设备及存储介质

    公开(公告)号:CN112884501A

    公开(公告)日:2021-06-01

    申请号:CN201911207323.7

    申请日:2019-11-29

    Abstract: 本申请公开了一种数据处理方法、装置、电子设备及存储介质,涉及机器学习模型的处理技术领域。具体实现方案为:获取目标用户使用的任务模型的训练状态;根据训练状态将目标用户划分到目标任务,目标任务为多任务学习模型中的一个任务,多任务学习模型配置有与训练状态匹配的任务;使用任务对目标用户进行预测。本申请实施例提供的数据处理方案,能够获取单任务模型对于目标用户的训练状态。多任务模型中根据不同的训练状态配置有不同的任务,根据训练状态将目标用户划分到相应的目标任务中,由目标任务对目标用户进行预测,进而使用与目标用户匹配度更高的目标任务对目标用户进行预测,能够更加准确的预测转化率,优化转化率的预测效果。

    数据归一化的方法、装置、电子设备及存储介质

    公开(公告)号:CN112822302A

    公开(公告)日:2021-05-18

    申请号:CN201911127228.6

    申请日:2019-11-18

    Abstract: 本申请公开了数据归一化的方法、装置、电子设备及存储介质,涉及数据处理领域,尤其是网络地址归一化处理技术领域。具体实现方案为:获取多个规则词表,多个规则词表由离线模块生成,多个规则词表分别记录不同作用范围的正则表达式;获取目标网络地址;根据多个规则词表,按照记录的正则表达式的作用范围由大至小的顺序,依次对网络地址进行字符匹配,得到归一化网络地址。依次使用多个规则对目标网络地址进行正则表达式的匹配,提高了网络地址归一化处理的准确性。在线模块无需进行规则词表的生成,因此在线模块能够不间断的对获取到的目标地址进行归一化处理,提高了网络地址归一化处理效率。

    转化率确定方法、装置、电子设备和存储介质

    公开(公告)号:CN112819498B

    公开(公告)日:2023-10-17

    申请号:CN201911130009.3

    申请日:2019-11-18

    Abstract: 本申请公开了一种转化率确定方法、装置、电子设备和存储介质,涉及人工智能技术领域。具体实现方案为:基于多任务模型中特征表示网络层,根据待预测用户数据和待预测媒介信息生成用户媒介特征表示;基于多任务模型中的通用模型,根据用户媒介特征表示确定待预测用户对待预测媒介信息的转化率;其中,多任务模型包括所述通用模型以及至少两个区间模型,不同区间模型关联有不同转化率区间,且通用模型与至少两个区间模型共享特征表示网络层。本申请实施例的多任务模型中包括通用模型及关联有不同转化率区间的区间模型,使得训练完的特征表示网络层可以准确全面的提取数据的特征表示,提高多任务模型的泛化能力,进而提高转化率预估的准确性。

    数据修正方法、装置、设备和存储介质

    公开(公告)号:CN112801682B

    公开(公告)日:2023-10-17

    申请号:CN201911112654.2

    申请日:2019-11-14

    Abstract: 本申请实施例公开了一种数据修正方法、装置、设备和存储介质,涉及大数据技术领域。具体实现方案为:根据已更新样本数据进行训练,得到稳定预测模型;根据未更新样本数据,从稳定预测模型中选择锚点预测模型;根据锚点预测模型对已更新样本数据和未更新样本数据进行预测,分别得到已更新预测结果和未更新预测结果;根据已更新预测结果和未更新预测结果,对未更新样本数据进行修正,用于采用修正后的未更新样本数据进行预测模型的训练。通过以相对完整的已更新样本数据对非完整的未更新样本数据进行修正,保证了样本数据在未达到转化周期而不完整的情况仍然能够参与模型的训练,提高了模型训练的时效性,同时保障了训练模型的准确率。

Patent Agency Ranking