-
公开(公告)号:CN115830869B
公开(公告)日:2024-12-20
申请号:CN202211503162.8
申请日:2022-11-28
Applicant: 中国石油大学(华东)
Abstract: 本发明公开了一种实时推荐无冲突停车位的深度强化学习方法,该方法包括如下步骤:将实时收集的空置停车位置数据作为停车感知数据,输入在VCS服务器上搭建的强化学习PPO模型中,通过特征网络进行特征提取,预测车辆的社交环境;然后经过策略网络得到车辆相应的策略概率分布,并利用价值网络计算V值,进而对两个网络进行更新直至收敛;在此过程中,VCS服务器会计算车辆停车感知状态的奖励并利用预测得出的车辆下一状态为车辆提供合适的停车策略;此外,本发明考虑了真实情况,利用博弈规则为车辆提供备选方案,解决了真实场景下因车辆增加,交通拥堵导致的寻找停车位困难以及停车位冲突的问题。
-
公开(公告)号:CN118278041A
公开(公告)日:2024-07-02
申请号:CN202410366949.7
申请日:2024-03-28
Applicant: 中国石油大学(华东)
IPC: G06F21/62 , G06F16/9535 , G06N3/042 , G06N3/092 , G06N5/04
Abstract: 本发明提出了一种基于差分隐私表征学习的因果推理增强型反事实交互式推荐系统。该系统建立了基于差分隐私表征学习的防御系统(CIRDP),以捕捉和减轻对抗性威胁,增强基于因果推理的联邦个性化互动推荐(FedRecs)。当把隐藏窃听对手的交互级成员推理攻击描述为对用户满意度产生对抗性影响的主要原因时,CIRDP将离线强化学习与因果推理结合到FedRecs中。CIRDP通过优化具有新颖的双重互信息目标的敏感度引导的解缠表征模块,创新性地提供了反事实满意度。因此,CIRDP引入了基于差分隐私表示学习的防御器,在保证交互行为级差分隐私(DP)的同时显著降低了隐私成本。针对最先进基线的广泛实验证明了CIRDP在减少推理攻击威胁和提高互动推荐的长期成功率方面的优越性。
-
公开(公告)号:CN117768876A
公开(公告)日:2024-03-26
申请号:CN202311704506.6
申请日:2023-12-13
Applicant: 中国石油大学(华东)
Abstract: 本发明通过在多智能体交互环境中引入一种新的联合学习策略,发明了一种去混淆的全网数据发布和重建方法,以实现隐私‑效用权衡(DECPUT)。在用户和服务提供商(SP)之间的对抗性时序情况中,DECPUT将移动性数据建模为两个相关的随机变量。其中一个变量(秘密)需要保持私密,而另一个变量(效用)则需要在隐私‑效用渐近纳什均衡中被公开。在这个为个体最优PUT奠定的理论基础上,DECPUT将A2C‑DRL和HRL模块纳入重建器‑鉴别器联合学习策略,以实现信息论上的最优在线联合策略,同时平衡隐私‑效用合作和竞争的利益。
-
公开(公告)号:CN116663839A
公开(公告)日:2023-08-29
申请号:CN202310700025.1
申请日:2023-06-14
Applicant: 中国石油大学(华东)
IPC: G06Q10/0631 , G06Q10/047 , G06Q50/26 , G06N3/04 , G06N3/08 , G06F18/214
Abstract: 本发明公开了一种基于多智能体强化学习的混合任务调度方法,主要解决交通任务巡逻中同时考虑离线违规热点和在线紧急任务的路线规划问题。该方法包括离线违规热点巡逻:通过基于张量的整数线规划模型,制定多个非重叠巡逻路线以获得最大的区域覆盖范围;在线突发事件监控:在离线路线指导下,通过本发明提出的多智能体强化学习框架对事件重要性进行评估,基于秘书问题求解来选择性处理突发异常事件。本发明综合考虑了日常巡逻路线规划和实时突发事件的混合任务调度场景,使得交通巡逻人员在进行巡逻路线决策时不仅能考虑历史交通数据,且能同时处理当前时刻的突发事件,实现更高效的交通任务管治。
-
公开(公告)号:CN115830869A
公开(公告)日:2023-03-21
申请号:CN202211503162.8
申请日:2022-11-28
Applicant: 中国石油大学(华东)
Abstract: 本发明公开了一种实时推荐无冲突停车位的深度强化学习方法,该方法包括如下步骤:将实时收集的空置停车位置数据作为停车感知数据,输入在VCS服务器上搭建的强化学习PPO模型中,通过特征网络进行特征提取,预测车辆的社交环境;然后经过策略网络得到车辆相应的策略概率分布,并利用价值网络计算V值,进而对两个网络进行更新直至收敛;在此过程中,VCS服务器会计算车辆停车感知状态的奖励并利用预测得出的车辆下一状态为车辆提供合适的停车策略;此外,本发明考虑了真实情况,利用博弈规则为车辆提供备选方案,解决了真实场景下因车辆增加,交通拥堵导致的寻找停车位困难以及停车位冲突的问题。
-
-
-
-