-
公开(公告)号:CN119141536A
公开(公告)日:2024-12-17
申请号:CN202411305119.X
申请日:2024-09-19
Applicant: 浙江工业大学 , 蔚复来(浙江)科技股份有限公司
IPC: B25J9/16
Abstract: 一种再生物品分拣的多机械臂深度强化学习控制方法和装置,其方法包括:获取目标物体和多机械臂系统状态信息;构建深度确定性策略梯度(Deep Deterministic Policy Gradient,DDPG)算法网络架构、设置经验回放池、智能体奖励函数;部署到真实分拣环境进行运动指导。其中,该方法在DDPG算法策略网络架构中使用循环神经网络(Recurrent Neural Network,RNN)作为主干特征提取网络,以捕捉输入数据的长期依赖关系,更好的指导机械臂的抓取策略;在评价网络架构中引入一对多判别架构,以适应多机械臂系统的训练;提出了一种复合奖励函数和双池经验回放机制,为机械臂提供更及时、更丰富的反馈信号,降低了数据相关性,提高样本利用率,提高多机械臂再生物品分拣的成功率和效率。
-
公开(公告)号:CN118674914A
公开(公告)日:2024-09-20
申请号:CN202410759941.7
申请日:2024-06-13
Applicant: 浙江工业大学 , 蔚复来(浙江)科技股份有限公司
IPC: G06V10/25 , G06V10/82 , G06N3/045 , G06N3/0464 , G06V10/774 , G06V10/776 , G06V10/764 , G06V10/80
Abstract: 本发明提供了一种融合Transformer与改进YOLO的再生物品旋转目标检测方法和装置,其方法包括:1、搜集不同形态同类可再生物品的数据图像,得到可再生物品原始数据集;2、引入密集编码标签(Densely Coded Labels,DCL),实现旋转角度的高精度识别;3、通过使用RepVGG模型作为主干特征提取网络,采用多分支的网络结构一般是能提高模型的表征能力;4、在主干网络末端加入Transformer的注意力机制,强化特征提取;5、使用BiFPN网络对骨干网络输出的特征进行后处理,增强不同尺度的特征信息融合;6、用训练数据集对搭建的目标检测网络进行训练,得到训练好的再生物品目标检测网络。
-