一种多智能体协同强化学习方法、终端及存储介质

    公开(公告)号:CN116226662A

    公开(公告)日:2023-06-06

    申请号:CN202310012741.0

    申请日:2023-01-05

    Abstract: 本发明公开了一种多智能体协同强化学习方法、终端及存储介质,方法包括:获取环境参数,构造模拟环境,并根据环境参数以及智能体数目确定学习者智能体;根据任务需求构造对应数量的工作者智能体,并根据任务需求构造对应数量的行动者智能体;其中,每个工作者智能体用于与多个行动者智能体进行交互,每个行动者智能体分别与一个独立的模拟环境交互;获取样本数据,根据样本数据对学习者智能体进行训练,得到训练后的模型参数;通过学习者智能体定期将训练后的模型参数更新到共享内存中,并通过工作者智能体定期从共享内存中更新决策网络的参数,得到强化学习后的策略。本发明提高了多智能体的强化学习过程中的样本利用率及样本数量。

    基于管道技术的以太坊网络拓扑仿真方法、装置、介质及终端

    公开(公告)号:CN115567401A

    公开(公告)日:2023-01-03

    申请号:CN202211016957.6

    申请日:2022-08-22

    Abstract: 本发明公开了一种基于管道技术的以太坊网络拓扑仿真方法、装置、介质及终端,方法包括,根据接收到的仿真区块链节点参数信息,生成初始化区块链网络;基于管道技术模拟初始化区块链网络中节点的通信操作,形成仿真节点;根据接收到的通信编码信息,改变仿真节点通信编码的方式,完成区块链网络的更新;本发明避免了网络层和传输层对数据包进行无谓的封装所带来的损耗,使用管道技术模拟网络通信避免了操作系统对网络报文发送的影响,可以更加精确的实现对节点间连接的流量控制、丢包率延迟抖动的仿真,可以在模拟区块链系统中可能发生的各种攻击,指导现实环境中区块链系统点对点网络的设计,避免了传统本地套接字通信的局限性。

    基于概率密度函数的工作量证明机制仿真方法、装置、介质及终端

    公开(公告)号:CN115562957A

    公开(公告)日:2023-01-03

    申请号:CN202211005140.9

    申请日:2022-08-22

    Abstract: 本发明公开了一种基于概率密度函数的工作量证明机制仿真方法、装置、介质及终端,方法包括:查询新区块的参数信息和仿真网络节点信息,得到仿真参数信息;将所述仿真参数信息输入到概率仿真算法中进行计算,得到最终仿真出块时间与最终出块节点序号;返回所述最终仿真出块时间与最终出块节点序号;本发明采用上述方法后利用工作量证明机制本身具有的概率特性,实现对共识算法的仿真,解决了现有仿真方法进行大量重复哈希计算的问题,只需要一次计算即可导出仿真出块时间,大大减少仿真环境中的资源消耗,最终实现对任意难度与任意算力情况下区块链网络的运行状态的仿真,并实现高保真的工作量证明算法出块时间仿真。

    一种联邦学习模型投毒防御方法、终端及存储介质

    公开(公告)号:CN115456192A

    公开(公告)日:2022-12-09

    申请号:CN202211000977.4

    申请日:2022-08-19

    Abstract: 本发明公开了一种联邦学习模型投毒防御方法、终端及存储介质,方法包括:根据各局部模型增量的范数及对应的数据集选择匹配的裁剪阈值,并根据选择的裁剪阈值对对应的局部模型增量进行自适应裁剪;根据裁剪后的局部模型增量确定当前全局模型增量的符号特征,并根据确定的当前全局模型增量的符号特征计算裁剪后的局部模型对应的选择系数;根据计算的选择系数将各裁剪后的局部模型进行选择性聚合,得到全局模型;本发明可以有效地防御标签翻转缩放攻击、符号翻转攻击、最小化最大距离攻击等模型投毒攻击手段,能够帮助中心服务器在不收集客户端原始数据、不加剧客户端本地计算量的情况下完成对本地模型的聚合,增强联邦学习框架的可靠性和鲁棒性。

    面向联邦学习数据投毒攻击的防御方法及装置

    公开(公告)号:CN113965359A

    公开(公告)日:2022-01-21

    申请号:CN202111152694.7

    申请日:2021-09-29

    Abstract: 本发明公开了一种面向联邦学习数据投毒攻击的防御方法及装置,方法包括:每个客户端使用本地数据训练模型参数;每个客户端将本地模型参数上传给服务器,服务器接收到所有的模型参数;服务器从中计算出一个用于比较的参考基准u,则对于任意的两个局部模型wa和wb,计算它们相对于参考基准u的相似度;采用内部投票的方法判断一个局部模型是否为恶意;根据每个局部模型所得的票数,计算每个局部模型的可信度;基于可信度的模型加权聚合,得到最终的全局模型,基于最终的全局模型实现数据投毒攻击的防御。本发明中,恶意客户端的模型会被赋予较低权重,在加权聚合时削弱它对全局模型的影响,从而实现针对数据投毒攻击的防御。

Patent Agency Ranking