-
公开(公告)号:CN111682972B
公开(公告)日:2020-11-03
申请号:CN202010819237.8
申请日:2020-08-14
Applicant: 支付宝(杭州)信息技术有限公司
Abstract: 本说明书实施例提供一种更新业务预测模型的方法和装置,其中业务预测模型包括通过强化学习实现的智能体。方法包括:获取业务请求,根据业务请求确定环境的状态特征;将状态特征输入智能体,智能体根据第一策略参数下的策略函数,确定对应的业务响应作为当前动作。然后,向环境输出业务响应,基于环境反馈确定当前奖励。接着,根据状态特征,当前动作和当前奖励,以损失函数最小化为目标,确定更新后的第二策略参数,其中损失函数与第一目标项负相关,所述第一目标项包括,采用高斯混合模型GMM,将第二策略参数下的策略函数表示为K个高斯分布的组合的第一表达式;于是,可以用第二策略参数下的策略函数,更新智能体。
-
公开(公告)号:CN115409269A
公开(公告)日:2022-11-29
申请号:CN202211070702.8
申请日:2022-09-02
Applicant: 支付宝(杭州)信息技术有限公司
Abstract: 本说明书实施例提供了一种执行时间预测方法和系统,所述方法包括:基于对象在多个历史时间点的历史特征值,预测得到所述对象的一个或多个样本路径,其中样本路径包括所述对象在预设的未来多个时间点的预测特征值;利用示性函数预测模型处理一个或多个样本路径,得到各样本路径中不同时间点对应的示性函数预测值;所述示性函数预测值指示所述对象在样本路径中相应时间点对应的预测特征值是否是最优值;分别基于各样本路径中不同时间点对应的示性函数预测值,确定各样本路径对应的最优时间点;将各样本路径中成为最优时间点的频次最高的时间点,作为对所述对象执行预设操作的执行时间。
-
公开(公告)号:CN113538069A
公开(公告)日:2021-10-22
申请号:CN202110962759.8
申请日:2021-08-20
Applicant: 支付宝(杭州)信息技术有限公司
Abstract: 本说明书实施例提供一种预测用户群体的宏观状态的方法和装置。根据该预测方法,可以基于多个用户中各个用户的事件序列,确定该用户对应的事件强度函数。此外,还获取用户群体的目标宏观量在第一时刻的第一期望值。基于以上确定的事件强度函数,以及表示用户对宏观量的影响程度的幅度函数,确定中间函数;其中,该幅度函数与目标宏观量的期望值成线性关系,比例系数为第一系数;且该中间函数基于各个第一系数与事件强度函数的乘积之和而确定。由此,可以将第一时刻,第一期望值,以及待预测的第二时刻,代入期望值随时间变化的关系式,从而确定该宏观量在第二时刻的期望值;其中,该关系式依赖于上述中间函数随时间的积分。
-
公开(公告)号:CN112232322A
公开(公告)日:2021-01-15
申请号:CN202011465431.7
申请日:2020-12-14
Applicant: 支付宝(杭州)信息技术有限公司
Abstract: 本说明书实施例提供了一种基于对象状态预测的图像生成方法及装置。在该方法中,获取多个图像帧按照时间序列形成的图像集,图像集包括在多个图像帧中位置发生移动的对象和所述对象之外的环境;将图像集输入特征提取模型,得到图像集的第一特征,其中包括对象的静态参数和环境的静态参数;从所述图像集中确定所述对象的第二特征,其中包含所述对象在图像集中的指定时刻的运动状态;将第一特征和第二特征输入状态预测模型,得到对象在指定时刻之后的至少一个目标时刻的预测运动状态;采用解码器,基于预测运动状态,生成在目标时刻的预测图像。
-
-
-