一种基于决策者偏好的人机交互方法

    公开(公告)号:CN119440264B

    公开(公告)日:2025-05-13

    申请号:CN202510038611.3

    申请日:2025-01-10

    Abstract: 本发明属于人机交互技术领域,具体涉及一种基于决策者偏好的人机交互方法,能够精确捕捉和量化决策者对于不同策略的偏好,选出最佳决策结果。该方法的具体过程为:与仿真环境交互进行轨迹数据生成;随机截取设定长度的轨迹数据,并两两组合进行决策者偏好标签标注,构成用于训练的样本数据;利用所述样本数据进行神经网络训练,神经网络输出每一时间步#imgabs0#对应的偏好得分和对应权重,得到偏好预测结果,计算损失函数并更新神经网络参数;将给定的若干个均衡策略输入仿真环境中,获得轨迹数据,利用训练好的神经网络获得轨迹数据的偏好得分和对应权重,进一步计算出最优的策略。

    一种基于安全强化学习的分布式多机器人路径规划方法

    公开(公告)号:CN119394314B

    公开(公告)日:2025-05-13

    申请号:CN202510002849.0

    申请日:2025-01-02

    Abstract: 本发明属于多机器人路径规划技术领域,具体涉及一种基于安全强化学习的分布式多机器人路径规划方法,为每个机器人提供分布式的运动策略,并有效降低机器人间发生冲突和碰撞的风险,提高运行效率。该方法设置状态空间为小尺度三通道局部观测地图,包括局部距离代价地图、邻居相对位置地图和邻居目标相对位置地图,将机器人与环境的信息以局部图的形式表示,有效提升了规模和场景的泛化性,基于广度优先搜索算法,构建了距离代价地图,从而将全局信息引入局部观测中,为易陷入局部最优的问题提供了有效的解决方案。

    一种基于决策者偏好的人机交互方法

    公开(公告)号:CN119440264A

    公开(公告)日:2025-02-14

    申请号:CN202510038611.3

    申请日:2025-01-10

    Abstract: 本发明属于人机交互技术领域,具体涉及一种基于决策者偏好的人机交互方法,能够精确捕捉和量化决策者对于不同策略的偏好,选出最佳决策结果。该方法的具体过程为:与仿真环境交互进行轨迹数据生成;随机截取设定长度的轨迹数据,并两两组合进行决策者偏好标签标注,构成用于训练的样本数据;利用所述样本数据进行神经网络训练,神经网络输出每一时间步#imgabs0#对应的偏好得分和对应权重,得到偏好预测结果,计算损失函数并更新神经网络参数;将给定的若干个均衡策略输入仿真环境中,获得轨迹数据,利用训练好的神经网络获得轨迹数据的偏好得分和对应权重,进一步计算出最优的策略。

    一种基于安全强化学习的分布式多机器人路径规划方法

    公开(公告)号:CN119394314A

    公开(公告)日:2025-02-07

    申请号:CN202510002849.0

    申请日:2025-01-02

    Abstract: 本发明属于多机器人路径规划技术领域,具体涉及一种基于安全强化学习的分布式多机器人路径规划方法,为每个机器人提供分布式的运动策略,并有效降低机器人间发生冲突和碰撞的风险,提高运行效率。该方法设置状态空间为小尺度三通道局部观测地图,包括局部距离代价地图、邻居相对位置地图和邻居目标相对位置地图,将机器人与环境的信息以局部图的形式表示,有效提升了规模和场景的泛化性,基于广度优先搜索算法,构建了距离代价地图,从而将全局信息引入局部观测中,为易陷入局部最优的问题提供了有效的解决方案。

    一种基于图景分析进行算子选择的传感器网络部署方法

    公开(公告)号:CN118764983A

    公开(公告)日:2024-10-11

    申请号:CN202410741599.8

    申请日:2024-06-11

    Abstract: 本发明提供一种基于图景分析进行算子选择的传感器网络部署方法,基于描述种群所在解空间特征的图景分析技术,提取了多种部署方案在解空间中的状态,包括种群P中的所有个体与最优个体之间的欧氏距离与覆盖率差异、种群P中最优的前10%的个体之间的欧氏距离、种群P中的所有个体的位置差异性,再根据提取出来的状态自适应选择变异算子对种群进行变异,实现了从解空间状态信息到合适的变异算子选择的策略映射,使用户在有限时间内得到覆盖率更高的部署方案,大幅提升了部署优化问题的求解效率,有效解决了传感器网络部署优化问题。

Patent Agency Ranking