一种基于多智能体强化学习的供应链自动化合约代理方法

    公开(公告)号:CN119648406B

    公开(公告)日:2025-04-25

    申请号:CN202510161946.4

    申请日:2025-02-14

    Inventor: 谢宇涛 杨诗宇

    Abstract: 本发明公开了一种基于多智能体强化学习的供应链自动化合约代理方法,步骤为:S1:根据斯塔克尔伯格模型和鲁宾斯坦模型具体建模供应链交易的两种典型场景;S2:通过斯塔克尔伯格模型和鲁宾斯坦模型获取专家经验,对智能体行为员网络进行基于专家经验的预训练;S3:根据博弈特性引入基于对手策略的价值预测、应用时序模型进行历史交易序列的特征提取、优先级经验回放机制,逐步优化智能体的策略。本发明显著提升了算法性能,处理复杂和动态的谈判任务,增强了智能体的前瞻性决策能力,加速了在训练初期的学习过程,在学习过程更专注于重要的经验,提升了整体的学习效率和策略成熟度。

    一种基于多智能体强化学习的供应链自动化合约代理方法

    公开(公告)号:CN119648406A

    公开(公告)日:2025-03-18

    申请号:CN202510161946.4

    申请日:2025-02-14

    Inventor: 谢宇涛 杨诗宇

    Abstract: 本发明公开了一种基于多智能体强化学习的供应链自动化合约代理方法,步骤为:S1:根据斯塔克尔伯格模型和鲁宾斯坦模型具体建模供应链交易的两种典型场景;S2:通过斯塔克尔伯格模型和鲁宾斯坦模型获取专家经验,对智能体行为员网络进行基于专家经验的预训练;S3:根据博弈特性引入基于对手策略的价值预测、应用时序模型进行历史交易序列的特征提取、优先级经验回放机制,逐步优化智能体的策略。本发明显著提升了算法性能,处理复杂和动态的谈判任务,增强了智能体的前瞻性决策能力,加速了在训练初期的学习过程,在学习过程更专注于重要的经验,提升了整体的学习效率和策略成熟度。

    基于类电磁诱导透明效应的温度检测太赫兹超表面传感器

    公开(公告)号:CN117848536A

    公开(公告)日:2024-04-09

    申请号:CN202410037305.3

    申请日:2024-01-10

    Abstract: 本发明公开了基于类电磁诱导透明效应的温度检测太赫兹超表面传感器,涉及太赫兹超表面技术领域,包括:具有数值的相对介电常数的介质基底、第一矩形金属线、第二矩形金属线、第一金属开口环形谐振器、第二金属开口环形谐振器、第三金属开口环形谐振器和第四金属开口环形谐振器,所述第一矩形金属线和第二矩形金属线均刻蚀于介质基底的上表面,且分别位于介质基底的左侧和下侧;所述第一金属开口环形谐振器、第二金属开口环形谐振器、第三金属开口环形谐振器和第四金属开口环形谐振器刻蚀于所述介质基底的上表面且各自的开口方向不同。本发明有效解决了太赫兹超表面传感器结构复杂以及传感灵敏度较低等问题。

Patent Agency Ranking