一种强化学习模型训练和业务执行方法、装置及电子设备

    公开(公告)号:CN117725985A

    公开(公告)日:2024-03-19

    申请号:CN202410171178.6

    申请日:2024-02-06

    Abstract: 本说明书公开了一种强化学习模型训练和业务执行方法、装置及电子设备。所述方法包括:获取用户针对指定业务场景构建的强化学习环境数据;响应于用户的指定操作,确定用户基于强化学习环境数据选择的目标智能体,并确定目标智能体的智能体配置信息;在预设算法库中确定出目标强化学习算法;基于目标智能体、智能体配置信息以及目标强化学习算法,构建强化学习模型,并对强化学习模型进行仿真,并将仿真过程中产生的数据存入经验回放池;根据从经验回放池中获取的训练数据以及奖励函数信息对强化学习模型进行训练。本方案极大的降低了用户的使用门槛,充分满足了用户对强化学习环境的多样化需求。

    一种强化学习模型训练和业务执行方法、装置及电子设备

    公开(公告)号:CN117725985B

    公开(公告)日:2024-05-24

    申请号:CN202410171178.6

    申请日:2024-02-06

    Abstract: 本说明书公开了一种强化学习模型训练和业务执行方法、装置及电子设备。所述方法包括:获取用户针对指定业务场景构建的强化学习环境数据;响应于用户的指定操作,确定用户基于强化学习环境数据选择的目标智能体,并确定目标智能体的智能体配置信息;在预设算法库中确定出目标强化学习算法;基于目标智能体、智能体配置信息以及目标强化学习算法,构建强化学习模型,并对强化学习模型进行仿真,并将仿真过程中产生的数据存入经验回放池;根据从经验回放池中获取的训练数据以及奖励函数信息对强化学习模型进行训练。本方案极大的降低了用户的使用门槛,充分满足了用户对强化学习环境的多样化需求。

Patent Agency Ranking