数据处理方法、装置、电子设备以及存储介质
Abstract:
本公开实施例提供了一种数据处理方法、装置、电子设备以及存储介质,涉及游戏和人工智能领域。该方法包括:确定待评估目标虚拟对象的待评估指标对应的目标虚拟场景,基于该目标虚拟场景的对初始策略网络重复执行训练操作得到目标策略网络;基于目标策略网络确定目标虚拟对象的评估结果;上述训练操作包括:获取当前次训练操作对应的目标虚拟场景的初始环境特征,基于该环境特征通过策略网络预测目标虚拟对象的行为序列,控制该对象在虚拟场景中执行序列中的各行为,得到新环境特征和游戏数据,根据游戏数据确定该序列对应的行为奖励,根据行为奖励确定训练损失以调整策略网络的网络参数。基于该方法,可以更加准确、客观的实现对虚拟对象的评估。
Patent Agency Ranking
0/0