-
公开(公告)号:CN116224775A
公开(公告)日:2023-06-06
申请号:CN202211098363.4
申请日:2022-09-08
Applicant: 电子科技大学
IPC: G05B13/04
Abstract: 本发明公开了一种面向连续动作空间的智能体控制任务求解方法,该方法包括:使用VAE来嵌入来自外部环境的观测值,并对输入数据进行降维处理;智能体与环境不断进行交互,生成用于训练策略的样本数据;采样虚拟目标,重新计算奖励后加入重放缓冲区,完成样本数据的扩充;通过对智能体已经实现的状态进行核密度估计,同时计算当前状态与期望目标状态的距离作为系数,生成每个时刻的内在奖励;利用内在奖励设置动态比率,选择下一个episode合适的初始状态;通过该训练方法,面向连续动作空间的智能体将自动学会智能体控制方法,实现人为布置的任务。本发明用于深度强化学习中的稀疏奖励任务,能够提高算法完成任务的性能。
-
公开(公告)号:CN116224775B
公开(公告)日:2025-05-02
申请号:CN202211098363.4
申请日:2022-09-08
Applicant: 电子科技大学
IPC: G05B13/04
Abstract: 本发明公开了一种面向连续动作空间的智能体控制任务求解方法,该方法包括:使用VAE来嵌入来自外部环境的观测值,并对输入数据进行降维处理;智能体与环境不断进行交互,生成用于训练策略的样本数据;采样虚拟目标,重新计算奖励后加入重放缓冲区,完成样本数据的扩充;通过对智能体已经实现的状态进行核密度估计,同时计算当前状态与期望目标状态的距离作为系数,生成每个时刻的内在奖励;利用内在奖励设置动态比率,选择下一个episode合适的初始状态;通过该训练方法,面向连续动作空间的智能体将自动学会智能体控制方法,实现人为布置的任务。本发明用于深度强化学习中的稀疏奖励任务,能够提高算法完成任务的性能。
-
公开(公告)号:CN115482265A
公开(公告)日:2022-12-16
申请号:CN202211070899.5
申请日:2022-08-31
Applicant: 电子科技大学
Abstract: 本发明提供一种基于连续视频流的室外场景深度补全方法,包括:对传感器输入的数据进行预处理形成RGB‑D数据;深度补全模块的图像分支接收RGB数据,通过图像分支的编解码器提取图像特征,图像分支解码器的输出与深度分支的相同尺寸的编码器的输入对应级联;深度补全模块的深度分支接收D数据以及数据流中前一帧的导向图,通过深度分支的编解码器输出初始补全深度图、当前帧的导向图以及亲和度矩阵;深度图优化模块接收深度分支的编解码器输出的初始补全深度图以及亲和度矩阵,输出优化后的补全深度图用于室外场景深度补全。本发明有效利用连续视频流中的上下文信息,提升了深度补全预测的准确性。
-
-