-
公开(公告)号:CN117968703B
公开(公告)日:2025-01-03
申请号:CN202410202846.7
申请日:2024-02-23
Applicant: 杭州电子科技大学
IPC: G01C21/20 , G06N3/006 , G06N3/092 , G06N3/0895 , G06N3/0464 , G06N3/0495 , G01C21/34
Abstract: 本发明公开了基于鸟瞰视角时空对比强化学习的自主导航方法,该方法首先设定状态空间和动作空间、奖励函数。其次构建基于鸟瞰视角时空对比学习的鸟瞰视角导航网络模型,初始化各网络参数,将初始观测的三维点云输入到鸟瞰视角导航网络模型中,智能体随机采样数据并将得到的数据对存入经验池,对经验池进行初始化。最后循环导航事件,设置目标点和行人位置,根据经验池存储的数据更新鸟瞰视角导航网络模型,根据更新后的鸟瞰视角导航网络选择动作并不断更新智能体的状态,直到移动智能体到达目标位置。本发明显著提升了智能体在复杂和动态环境中的自主探索成功率和导航效率,具备重要的理论和实际应用价值。
-
公开(公告)号:CN117968703A
公开(公告)日:2024-05-03
申请号:CN202410202846.7
申请日:2024-02-23
Applicant: 杭州电子科技大学
IPC: G01C21/20 , G06N3/006 , G06N3/092 , G06N3/0895 , G06N3/0464 , G06N3/0495 , G01C21/34
Abstract: 本发明公开了基于鸟瞰视角时空对比强化学习的自主导航方法,该方法首先设定状态空间和动作空间、奖励函数。其次构建基于鸟瞰视角时空对比学习的鸟瞰视角导航网络模型,初始化各网络参数,将初始观测的三维点云输入到鸟瞰视角导航网络模型中,智能体随机采样数据并将得到的数据对存入经验池,对经验池进行初始化。最后循环导航事件,设置目标点和行人位置,根据经验池存储的数据更新鸟瞰视角导航网络模型,根据更新后的鸟瞰视角导航网络选择动作并不断更新智能体的状态,直到移动智能体到达目标位置。本发明显著提升了智能体在复杂和动态环境中的自主探索成功率和导航效率,具备重要的理论和实际应用价值。
-
公开(公告)号:CN119952694A
公开(公告)日:2025-05-09
申请号:CN202510022599.7
申请日:2025-01-07
Applicant: 杭州电子科技大学
IPC: B25J9/16 , G06T7/00 , G06T7/73 , G06T7/50 , G06V10/764 , G06V10/40 , G06V10/82 , G06N3/092 , G06N3/0464 , G06N3/048 , G06N3/0455 , G06N3/084
Abstract: 本发明公开了一种基于视觉语言模型的机械臂自主抓取系统及其控制方法,该方法首先初始化机械臂,采集工作区间的彩色图像和深度图像。其次基于彩色图像和自然语言描述,生成目标物体边界框以及置信度,判断场景中是否存在目标物体;不存在目标物体时,对当前场景中可见物体进行实例分割和抓取可行性检测。然后将深度图像与通过抓取可行性检测的物体二值掩码送入交互物体选择策略、动作选择策略,得到待交互物体以及推动动作方向。最后获取待交互物体中心坐标,机械臂中心坐标与推动动作方向移动障碍物,直到目标物体出现且可抓取,机械臂抓取目标物体并放置在指定位置。本发明准确的实现对人类自然语言指定的物体进行识别并抓取。
-
公开(公告)号:CN118861965A
公开(公告)日:2024-10-29
申请号:CN202410840724.0
申请日:2024-06-27
Applicant: 杭州电子科技大学
IPC: G06F18/25 , G06N3/0464 , G06N3/0455 , G06N3/0499 , G06N3/09 , G06N3/092 , G06V20/58 , G06V10/25 , G06V10/26 , G06V20/70 , G06V10/44 , G06V10/42 , G06V10/52 , G06V10/80 , G06V10/82 , G01S13/86 , G01D21/02 , B60W50/00 , B60W60/00
Abstract: 本发明属于深度强化学习自动驾驶领域,涉及车辆安全决策技术,具体是一种基于多模态时空表征的级联深度强化学习安全决策方法,其先构建了一个多模态时空感知编码器从多模态连续输入中联合建模空间和运动信息,以获取动态驾驶场景的当前感知表征;而后,引入未来预测编码器从当前感知表征中捕获不同交通参与者之间的交互,获取未来预测表征;而后,连接当前感知表征和未来预测表征形成多模态时空表征并作为强化学习的状态输入,以全面把握场景,并结合分布式PPO算法,在针对安全决策设计的奖励函数指导下实现安全决策任务。本发明具有很高的环境适应性和决策成功率,能够在稠密交通场景中以及突发事件下实现智能汽车的主动安全决策任务。
-
-
-