一种基于大语言模型的舆情传播建模仿真和风险预警方法

    公开(公告)号:CN117575829B

    公开(公告)日:2024-09-13

    申请号:CN202311591174.5

    申请日:2023-11-24

    Abstract: 本说明书公开了一种基于大语言模型的舆情传播建模仿真和风险预警方法,可以获取事件舆情信息,并根据该事件舆情信息对预设的大语言模型进行微调训练,而后,可以初始化拓扑网络,并初始化智能体的自身特征,在每一轮迭代中,确定智能体的记忆流信息,并从记忆流信息中筛选出目标信息,将上一轮迭代中更新得到的自身特征以及所述目标信息输入到所述大语言模型,得到本轮迭代中更新得到的自身特征,将本轮迭代中更新得到的自身特征输入到大语言模型中,得到预测出的智能体针对目标事件的行为信息,并更新所述拓扑网络,以进行下一轮迭代。最后,可以根据每一轮迭代中预测得到的各智能体的行为信息,进行风险预警。

    一种强化学习模型训练和业务执行方法、装置及电子设备

    公开(公告)号:CN117725985A

    公开(公告)日:2024-03-19

    申请号:CN202410171178.6

    申请日:2024-02-06

    Abstract: 本说明书公开了一种强化学习模型训练和业务执行方法、装置及电子设备。所述方法包括:获取用户针对指定业务场景构建的强化学习环境数据;响应于用户的指定操作,确定用户基于强化学习环境数据选择的目标智能体,并确定目标智能体的智能体配置信息;在预设算法库中确定出目标强化学习算法;基于目标智能体、智能体配置信息以及目标强化学习算法,构建强化学习模型,并对强化学习模型进行仿真,并将仿真过程中产生的数据存入经验回放池;根据从经验回放池中获取的训练数据以及奖励函数信息对强化学习模型进行训练。本方案极大的降低了用户的使用门槛,充分满足了用户对强化学习环境的多样化需求。

    一种基于代理模型的仿真模拟方法、装置及电子设备

    公开(公告)号:CN117215728B

    公开(公告)日:2024-03-15

    申请号:CN202311464152.2

    申请日:2023-11-06

    Abstract: 本说明书公开了一种基于代理模型的仿真模拟方法、装置及电子设备。所述方法包括:将历史业务数据输入仿真模型,得到每个历史业务数据对应的目标仿真结果;确定仿真模型对应的若干种代理模型,代理模型包括:高斯过程模型、神经网络模型、克里金模型以及插值模型;根据历史业务数据以及目标仿真结果,生成训练样本对各代理模型进行训练,得到各训练后代理模型,并将各训练后代理模型集成并部署在仿真环境中;在接收到仿真指令后,获取仿真数据;确定用户选择的至少一种训练后代理模型,作为目标代理模型;将仿真数据输入各目标代理模型,以通过各目标代理模型确定仿真模拟结果。

    一种基于非合作博弈的策略生成方法及装置

    公开(公告)号:CN117252234B

    公开(公告)日:2024-03-01

    申请号:CN202311531148.3

    申请日:2023-11-16

    Abstract: 本说明书公开了一种基于非合作博弈的策略生成方法及装置,通过构建目标用户对应的图数据,针对每个智能体,根据该智能体的被观测概率以及背叛参数,确定该智能体的背叛行为策略。根据各邻居智能体的背叛行为策略和各邻居智能体的被观测概率,通过该智能体的惩罚参数,确定该智能体分别对各邻居智能体的第一惩罚行为策略。进而参考各智能体在背叛行为策略和第一惩罚行为策略的影响下,更新该智能体的背叛参数和惩罚参数,用于确定各智能体的行为策略。从上述方法可以看出,通过构建目标用户对应的图数据,参考了与目标用户相关用户的行为策略的影响,以及实时更新目标用户的惩罚参数和背叛参数,得到的行为策略,更准确、实效性强。(56)对比文件Marco Casari等.Decentralizedmanagement of common property resources:experiments with a centuries-oldinstitution.Journal of Economic Behavior& Organization.2003,全文.裴华艳;闫光辉;王焕民.基于行为惩罚的合作演化研究.兰州交通大学学报.2020,(02),全文.王浩云;张顺颐;赵振东;马燕玲.基于不完全信息博弈的P2P网络节点行为策略模型.应用科学学报.2008,(05),全文.于建业;王元卓;靳小龙;程学旗.基于社交演化博弈的社交网络用户信息分享行为演化分析.电子学报.2018,(01),全文.谢逢洁;武小平;崔文田;陈子凤.博弈参与水平对无标度网络上合作行为演化的影响.中国管理科学.2017,(05),全文.

    一种基于大语言模型的舆情传播建模仿真和风险预警方法

    公开(公告)号:CN117575829A

    公开(公告)日:2024-02-20

    申请号:CN202311591174.5

    申请日:2023-11-24

    Abstract: 本说明书公开了一种基于大语言模型的舆情传播建模仿真和风险预警方法,可以获取事件舆情信息,并根据该事件舆情信息对预设的大语言模型进行微调训练,而后,可以初始化拓扑网络,并初始化智能体的自身特征,在每一轮迭代中,确定智能体的记忆流信息,并从记忆流信息中筛选出目标信息,将上一轮迭代中更新得到的自身特征以及所述目标信息输入到所述大语言模型,得到本轮迭代中更新得到的自身特征,将本轮迭代中更新得到的自身特征输入到大语言模型中,得到预测出的智能体针对目标事件的行为信息,并更新所述拓扑网络,以进行下一轮迭代。最后,可以根据每一轮迭代中预测得到的各智能体的行为信息,进行风险预警。

    一种确定电能资源分配策略的方法、装置及设备

    公开(公告)号:CN117371718A

    公开(公告)日:2024-01-09

    申请号:CN202311342169.0

    申请日:2023-10-16

    Abstract: 在本说明书提供的一种确定电能资源分配策略的方法、装置及设备中,通过设置充电站智能体和电动汽车智能体的交互环境,针对每个智能体,根据当前状态信息,确定其第一行为策略,以及根据该第一行为策略确定第一评估结果,根据各智能体已确定的各个体收益值,量化各智能体间的相关性,并参考该智能体与其他智能体的相关性、各智能体的当前状态信息和第一行为策略及第一评估结果,迭代更新该智能体的第一执行者网络,直至收敛,该第一执行者网络用于确定该智能体的电能资源分配策略。从上述方法可以看出,通过量化智能体间的相关性,考虑了不同智能体间的交互影响,使得通过迭代更新直至收敛的第一执行者网络得到的电能资源分配策略更准确。

    一种基于非合作博弈的策略生成方法及装置

    公开(公告)号:CN117252234A

    公开(公告)日:2023-12-19

    申请号:CN202311531148.3

    申请日:2023-11-16

    Abstract: 本说明书公开了一种基于非合作博弈的策略生成方法及装置,通过构建目标用户对应的图数据,针对每个智能体,根据该智能体的被观测概率以及背叛参数,确定该智能体的背叛行为策略。根据各邻居智能体的背叛行为策略和各邻居智能体的被观测概率,通过该智能体的惩罚参数,确定该智能体分别对各邻居智能体的第一惩罚行为策略。进而参考各智能体在背叛行为策略和第一惩罚行为策略的影响下,更新该智能体的背叛参数和惩罚参数,用于确定各智能体的行为策略。从上述方法可以看出,通过构建目标用户对应的图数据,参考了与目标用户相关用户的行为策略的影响,以及实时更新目标用户的惩罚参数和背叛参数,得到的行为策略,更准确、实效性强。

    一种强化学习模型训练和业务执行方法、装置及电子设备

    公开(公告)号:CN117725985B

    公开(公告)日:2024-05-24

    申请号:CN202410171178.6

    申请日:2024-02-06

    Abstract: 本说明书公开了一种强化学习模型训练和业务执行方法、装置及电子设备。所述方法包括:获取用户针对指定业务场景构建的强化学习环境数据;响应于用户的指定操作,确定用户基于强化学习环境数据选择的目标智能体,并确定目标智能体的智能体配置信息;在预设算法库中确定出目标强化学习算法;基于目标智能体、智能体配置信息以及目标强化学习算法,构建强化学习模型,并对强化学习模型进行仿真,并将仿真过程中产生的数据存入经验回放池;根据从经验回放池中获取的训练数据以及奖励函数信息对强化学习模型进行训练。本方案极大的降低了用户的使用门槛,充分满足了用户对强化学习环境的多样化需求。

Patent Agency Ranking