-
公开(公告)号:CN115009291B
公开(公告)日:2023-05-23
申请号:CN202210562890.X
申请日:2022-05-23
Applicant: 暨南大学
IPC: B60W50/00 , B60W60/00 , G06N3/042 , G06N3/092 , G06N3/0455
Abstract: 本发明公开了一种基于网络演化重放缓冲区的自动驾驶辅助决策方法及系统,该方法步骤包括:使用强化学习智能体对基于驾驶时态序列数据的环境进行交互,根据相同取值的状态或者动作的数据作为枢纽转化成包含状态节点集合和动作节点集合的基于图结构的重放缓冲区;再基于该重放缓冲区进行深度遍历搜索得到子图,将子图输入到图自动编码器中进行特征提取,获取包含邻居信息的新的状态节点表示。根据新的状态节点表示进行学习,最终输出自动驾驶辅助执行策略,调整汽车驾驶状态。本发明利用图神经网络的节点表示能力,获取包含邻居信息的状态节点表示,一方面解决了样本相关性的问题,另一方面仍然保留邻居信息,能够更加快速解决决策问题。
-
公开(公告)号:CN114692005B
公开(公告)日:2022-08-12
申请号:CN202210604217.8
申请日:2022-05-31
Applicant: 暨南大学
IPC: G06F16/9535 , G06N3/04 , G06N3/08 , G06Q30/02 , G06Q30/06
Abstract: 本发明公开了一种面向稀疏超短序列的个性化推荐方法、系统、介质和设备,该方法包括下述步骤:构建稀疏超短用户行为序列,构建用户与商品的关系图,采用图嵌入方法对关系图中的节点进行嵌入表示学习;基于稀疏超短用户行为数据构造专家数据库,对专家数据库的购买策略进行学习,并遵循购买策略进行稀疏超短用户行为序列扩充;基于商品预嵌入表示以及扩充后的稀疏超短用户行为序列,采用自注意力模型完成商品嵌入表示的信息增强,并根据最终商品嵌入表示与稀疏超短用户行为序列的用户行为数据得到用户嵌入表示,进行个性化推荐。本发明能提高输入自注意力模型数据质量,实现自注意力模型在面向稀疏超短数据推荐场景中的应用。
-
公开(公告)号:CN115009291A
公开(公告)日:2022-09-06
申请号:CN202210562890.X
申请日:2022-05-23
Applicant: 暨南大学
Abstract: 本发明公开了一种基于网络演化重放缓冲区的自动驾驶辅助决策方法及系统,该方法步骤包括:使用强化学习智能体对基于驾驶时态序列数据的环境进行交互,根据相同取值的状态或者动作的数据作为枢纽转化成包含状态节点集合和动作节点集合的基于图结构的重放缓冲区;再基于该重放缓冲区进行深度遍历搜索得到子图,将子图输入到图自动编码器中进行特征提取,获取包含邻居信息的新的状态节点表示。根据新的状态节点表示进行学习,最终输出自动驾驶辅助执行策略,调整汽车驾驶状态。本发明利用图神经网络的节点表示能力,获取包含邻居信息的状态节点表示,一方面解决了样本相关性的问题,另一方面仍然保留邻居信息,能够更加快速解决决策问题。
-
公开(公告)号:CN114692005A
公开(公告)日:2022-07-01
申请号:CN202210604217.8
申请日:2022-05-31
Applicant: 暨南大学
IPC: G06F16/9535 , G06N3/04 , G06N3/08 , G06Q30/02 , G06Q30/06
Abstract: 本发明公开了一种面向稀疏超短序列的个性化推荐方法、系统、介质和设备,该方法包括下述步骤:构建稀疏超短用户行为序列,构建用户与商品的关系图,采用图嵌入方法对关系图中的节点进行嵌入表示学习;基于稀疏超短用户行为数据构造专家数据库,对专家数据库的购买策略进行学习,并遵循购买策略进行稀疏超短用户行为序列扩充;基于商品预嵌入表示以及扩充后的稀疏超短用户行为序列,采用自注意力模型完成商品嵌入表示的信息增强,并根据最终商品嵌入表示与稀疏超短用户行为序列的用户行为数据得到用户嵌入表示,进行个性化推荐。本发明能提高输入自注意力模型数据质量,实现自注意力模型在面向稀疏超短数据推荐场景中的应用。
-
-
-