-
公开(公告)号:CN117236385A
公开(公告)日:2023-12-15
申请号:CN202311122126.1
申请日:2023-09-01
Applicant: 北京交通大学
IPC: G06N3/0455 , G06N3/092
Abstract: 本发明公开了一种多智能体孪生注意力强化学习系统及方法,涉及多智能体深度强化学习技术领域,每个智能体通过在与多智能体环境交互时最大化累积奖励来学习,通过四个神经网络的协同作用,智能体通过延迟衰减策略在执行期间做出决策,最终可使每个智能体与环境交互,获取观察结果,并采用延迟衰减策略进行决策和执行操作,环境同时给智能体相应奖励反馈并进行下一次观察,全部过程存储在经验重放存储器,使孪生注意力评判器、延迟衰减策略的目标和孪生注意力评判器的目标完成训练,以实现解决多智能体环境下的联合高估和次优策略问题。每个智能体通过在与多智能体环境交互时最大化累积奖励来学习,与之前的方法相比具有竞争性的性能。
-
公开(公告)号:CN116735936B
公开(公告)日:2023-10-13
申请号:CN202311022356.0
申请日:2023-08-15
Applicant: 北京交通大学
IPC: G01R15/04
Abstract: 本发明公开了一种宽频带电阻分压器频响平坦度的闭环控制电路,涉及宽频带电阻分压器技术领域,包括依次连接的阶跃发生器、宽频带电路分压器、采样保持器、单刀双掷模拟开关、过零检测器和数字电位器,阶跃发生器的输入是一个时钟信号,采样保持器的输出端和小于0V的恒定电压Vm分别作为单刀双掷模拟开关的输入,数字电位器的输出端与宽频带电阻分压器中的压控电容连接。本发明采用上述结构的一种宽频带电阻分压器频响平坦度的闭环控制电路,通过电容补偿减少寄生元件对宽频带电阻分压器频率特性的影响,实现在宽频率范围内平坦的频率响应。
-