转化率预测方法、装置、设备和存储介质

    公开(公告)号:CN112819497A

    公开(公告)日:2021-05-18

    申请号:CN201911128977.0

    申请日:2019-11-18

    Abstract: 本申请实施例公开一种转化率预测方法、装置、设备和存储介质,涉及大数据技术领域。具体实现方案为:获取待预测用户数据,以及待预测媒介信息;根据待预测媒介信息所属的投放方,在多任务模型中确定投放方关联的目标子模型;其中,多任务模型中的子模型是基于样本数据的场景信息训练得到,目标子模型是基于子模型对于投放方的预测结果确定的;基于目标子模型,根据待预测用户数据和待预测媒介信息,得到待预测用户对待预测媒介信息的转化率。本申请实施例通过采用多任务模型来预测用户对媒介信息的转化率,避免单任务模型中无法进行多层面的特征学习,充分考虑媒介信息在各场景维度下的场景特征,提高多任务模型进行转化率预测的准确率。

    一种数据拼接方法、装置、电子设备和存储介质

    公开(公告)号:CN112817965A

    公开(公告)日:2021-05-18

    申请号:CN201911128994.4

    申请日:2019-11-18

    Abstract: 本申请公开了一种数据拼接方法、装置、电子设备和存储介质,涉及大数据处理技术领域。具体实现方案为:从至少两个数据分桶中为待拼接的目标数据选择目标分桶;将所述目标数据分发到所述目标分桶的未拼接数据中,以指示所述目标分桶在监测到拼接触发事件时,对所述未拼接数据进行拼接;其中所述拼接触发事件根据所述目标分桶中的未拼接数据和已拼接数据生成。本申请实施例由于目标分桶中的未拼接数据和已拼接数据是动态变化的,而根据未拼接数据和已拼接数据的数量生成拼接触发事件,可到达动态调整拼接时间间隔的目的,也即可自适应调整数据拼接频率,由此既保证了数据的时效性,还能减少整个拼接过程中计算资源的消耗,提升计算效率。

    数据归一化的方法、装置、电子设备及存储介质

    公开(公告)号:CN112822302B

    公开(公告)日:2023-03-24

    申请号:CN201911127228.6

    申请日:2019-11-18

    Abstract: 本申请公开了数据归一化的方法、装置、电子设备及存储介质,涉及数据处理领域,尤其是网络地址归一化处理技术领域。具体实现方案为:获取多个规则词表,多个规则词表由离线模块生成,多个规则词表分别记录不同作用范围的正则表达式;获取目标网络地址;根据多个规则词表,按照记录的正则表达式的作用范围由大至小的顺序,依次对网络地址进行字符匹配,得到归一化网络地址。依次使用多个规则对目标网络地址进行正则表达式的匹配,提高了网络地址归一化处理的准确性。在线模块无需进行规则词表的生成,因此在线模块能够不间断的对获取到的目标地址进行归一化处理,提高了网络地址归一化处理效率。

    一种转化数据处理的方法、装置、电子设备及存储介质

    公开(公告)号:CN112819491B

    公开(公告)日:2024-02-09

    申请号:CN201911120892.8

    申请日:2019-11-15

    Abstract: 本申请公开了转化数据处理的方法、装置、电子设备及存储介质,涉及数据处理领域,尤其是目标转化出价中的转化数据处理技术。具体实现方案为:根据指标参数对多种类型的转化数据进行归一化处理,得到归一化数据,归一化数据包括基于时间的指标值序列;根据时间权重判断指标值序列是否存在异常数据;若存在异常数据,从指标值序列中删除异常数据。归一化处理能够将多种类型的转化数据转化为具有相同数据结构的归一化数据,基于时间权重对归一化数据包含的指标值序列进行异常数据检测,能够提高异常数据检测的准确性。

    一种数据拼接方法、装置、电子设备和存储介质

    公开(公告)号:CN112817965B

    公开(公告)日:2023-10-17

    申请号:CN201911128994.4

    申请日:2019-11-18

    Abstract: 本申请公开了一种数据拼接方法、装置、电子设备和存储介质,涉及大数据处理技术领域。具体实现方案为:从至少两个数据分桶中为待拼接的目标数据选择目标分桶;将所述目标数据分发到所述目标分桶的未拼接数据中,以指示所述目标分桶在监测到拼接触发事件时,对所述未拼接数据进行拼接;其中所述拼接触发事件根据所述目标分桶中的未拼接数据和已拼接数据生成。本申请实施例由于目标分桶中的未拼接数据和已拼接数据是动态变化的,而根据未拼接数据和已拼接数据的数量生成拼接触发事件,可到达动态调整拼接时间间隔的目的,也即可自适应调整数据拼接频率,由此既保证了数据的时效性,还能减少整个拼接过程中计算资源的消耗,提升计算效率。

    数据处理方法、装置、电子设备及存储介质

    公开(公告)号:CN112884501B

    公开(公告)日:2023-10-10

    申请号:CN201911207323.7

    申请日:2019-11-29

    Abstract: 本申请公开了一种数据处理方法、装置、电子设备及存储介质,涉及机器学习模型的处理技术领域。具体实现方案为:获取目标用户使用的任务模型的训练状态;根据训练状态将目标用户划分到目标任务,目标任务为多任务学习模型中的一个任务,多任务学习模型配置有与训练状态匹配的任务;使用任务对目标用户进行预测。本申请实施例提供的数据处理方案,能够获取单任务模型对于目标用户的训练状态。多任务模型中根据不同的训练状态配置有不同的任务,根据训练状态将目标用户划分到相应的目标任务中,由目标任务对目标用户进行预测,进而使用与目标用户匹配度更高的目标任务对目标用户进行预测,能够更加准确的预测转化率,优化转化率的预测效果。

Patent Agency Ranking