-
公开(公告)号:CN114118441B
公开(公告)日:2024-10-22
申请号:CN202111401793.4
申请日:2021-11-24
Applicant: 福州大学
IPC: G06N20/00 , G06F16/903 , G06F16/901 , B25J9/16
Abstract: 本发明提出一种基于高效搜索策略在不确定性环境下的在线规划方法,将机器人的状态视为一个信念,以POMDP算法初始化当前信念的上、下边界后,通过折扣化上下限表示当前信念的全部信息进而执行前向搜索构建信念树,以此获得当前信念下的最优策略;所述信念树的每一个节点代表一个信念,父节点与子节点通过行为‑观测分支连接。本发明提供的DESPOT‑DULB算法性能优于DESPOT和POMCP,在收敛速度以及策略质量上具有优势。
-
公开(公告)号:CN117311154A
公开(公告)日:2023-12-29
申请号:CN202311386376.6
申请日:2023-10-25
Applicant: 福州大学
IPC: G05B13/04
Abstract: 本发明涉及一种基于信息熵回报策略在部分可观环境的在线规划方法。用于机器人执行任务时的在线快速规划,在部分可观测环境下,现有POMDP在线规划方法存在采样盲目性和搜索效率局限性,移动机器人无法快速执行规划任务;机器人结合状态分布和高斯分布建立采样模块,选取采样模块中权重最佳的N个状态前向构建信念树,通过基于信息熵回报设计的回报函数,指导机器人的搜索方向。最后对信念树自上而下的扩展叶子节点并更新节点边界值(效用上、下限值),自下而上的更新父节点边界值,直到信念树根节点的不确定性为一个极小值的时候,终止信念树的探索;POMDP算法是在线POMDP规划算法IE‑DESPOT;本发明性能优于DESPOT和POMCP、LB‑DESPOT,在收敛速度和策略质量上具有优势。
-
公开(公告)号:CN114118441A
公开(公告)日:2022-03-01
申请号:CN202111401793.4
申请日:2021-11-24
Applicant: 福州大学
IPC: G06N20/00 , G06F16/903 , G06F16/901 , B25J9/16
Abstract: 本发明提出一种基于高效搜索策略在不确定性环境下的在线规划方法,将机器人的状态视为一个信念,以POMDP算法初始化当前信念的上、下边界后,通过折扣化上下限表示当前信念的全部信息进而执行前向搜索构建信念树,以此获得当前信念下的最优策略;所述信念树的每一个节点代表一个信念,父节点与子节点通过行为‑观测分支连接。本发明提供的DESPOT‑DULB算法性能优于DESPOT和POMCP,在收敛速度以及策略质量上具有优势。
-
-