-
公开(公告)号:CN115009291A
公开(公告)日:2022-09-06
申请号:CN202210562890.X
申请日:2022-05-23
Applicant: 暨南大学
Abstract: 本发明公开了一种基于网络演化重放缓冲区的自动驾驶辅助决策方法及系统,该方法步骤包括:使用强化学习智能体对基于驾驶时态序列数据的环境进行交互,根据相同取值的状态或者动作的数据作为枢纽转化成包含状态节点集合和动作节点集合的基于图结构的重放缓冲区;再基于该重放缓冲区进行深度遍历搜索得到子图,将子图输入到图自动编码器中进行特征提取,获取包含邻居信息的新的状态节点表示。根据新的状态节点表示进行学习,最终输出自动驾驶辅助执行策略,调整汽车驾驶状态。本发明利用图神经网络的节点表示能力,获取包含邻居信息的状态节点表示,一方面解决了样本相关性的问题,另一方面仍然保留邻居信息,能够更加快速解决决策问题。
-
公开(公告)号:CN115009291B
公开(公告)日:2023-05-23
申请号:CN202210562890.X
申请日:2022-05-23
Applicant: 暨南大学
IPC: B60W50/00 , B60W60/00 , G06N3/042 , G06N3/092 , G06N3/0455
Abstract: 本发明公开了一种基于网络演化重放缓冲区的自动驾驶辅助决策方法及系统,该方法步骤包括:使用强化学习智能体对基于驾驶时态序列数据的环境进行交互,根据相同取值的状态或者动作的数据作为枢纽转化成包含状态节点集合和动作节点集合的基于图结构的重放缓冲区;再基于该重放缓冲区进行深度遍历搜索得到子图,将子图输入到图自动编码器中进行特征提取,获取包含邻居信息的新的状态节点表示。根据新的状态节点表示进行学习,最终输出自动驾驶辅助执行策略,调整汽车驾驶状态。本发明利用图神经网络的节点表示能力,获取包含邻居信息的状态节点表示,一方面解决了样本相关性的问题,另一方面仍然保留邻居信息,能够更加快速解决决策问题。
-
公开(公告)号:CN110458429A
公开(公告)日:2019-11-15
申请号:CN201910689985.6
申请日:2019-07-29
Applicant: 暨南大学
Abstract: 本发明公开了一种针对具有一定地理位置特征的网点的智能拜访任务分配和人员调度方法、系统,包括以下步骤:从企业信息系统决策模块的基础数据和实时数据中,对物理商业网点和业务员分别提取特征,对业务员拜访网点的历史数据建模;用二分图表示业务员和网点之间的连接从而形成拜访计划网络图;根据业务员所处环境信息,规划最优拜访路线;使用强化学习方法,根据业务员执行某一动作后产生的预设的奖赏或惩罚,评估分配策略获取的收益,并反馈给深度神经网络模型,反复更新学习参数,确定最优任务匹配策略;实际拜访过程中,采用强化学习方法进行计算,将任务执行策略优化方法以及拜访路线优化方法同时不断迭代,综合得出全局最优的拜访方式。
-
-