Patent search ap:("之江实验室") AND inv:"张杨" Page 1

1.

发明授权
一种基于大语言模型的舆情传播建模仿真和风险预警方法有权

公开(公告)号：CN117575829B

公开(公告)日：2024-09-13

申请号：CN202311591174.5

申请日：2023-11-24

Applicant: 之江实验室

Inventor： 张杨 , 王超 , 王永恒 , 晁玉珊 , 董世海 , 李磊 , 邵彬 , 肖恒进 , 董子铭 , 杨亚飞 , 韩珺婷

IPC: G06Q50/00 , G06Q10/04 , G06N3/006 , G06N20/00

Abstract: 本说明书公开了一种基于大语言模型的舆情传播建模仿真和风险预警方法，可以获取事件舆情信息，并根据该事件舆情信息对预设的大语言模型进行微调训练，而后，可以初始化拓扑网络，并初始化智能体的自身特征，在每一轮迭代中，确定智能体的记忆流信息，并从记忆流信息中筛选出目标信息，将上一轮迭代中更新得到的自身特征以及所述目标信息输入到所述大语言模型，得到本轮迭代中更新得到的自身特征，将本轮迭代中更新得到的自身特征输入到大语言模型中，得到预测出的智能体针对目标事件的行为信息，并更新所述拓扑网络，以进行下一轮迭代。最后，可以根据每一轮迭代中预测得到的各智能体的行为信息，进行风险预警。

2.

发明公开
一种强化学习模型训练和业务执行方法、装置及电子设备有权

公开(公告)号：CN117725985A

公开(公告)日：2024-03-19

申请号：CN202410171178.6

申请日：2024-02-06

Applicant: 之江实验室

Inventor： 张杨 , 王超 , 陈卫 , 陈振宇 , 王永恒 , 郑黄河 , 恽爽 , 曾洪海 , 连建晓 , 王梦丝 , 路游 , 周春来 , 鲁艺

IPC: G06N3/092 , G06F30/27

Abstract: 本说明书公开了一种强化学习模型训练和业务执行方法、装置及电子设备。所述方法包括：获取用户针对指定业务场景构建的强化学习环境数据；响应于用户的指定操作，确定用户基于强化学习环境数据选择的目标智能体，并确定目标智能体的智能体配置信息；在预设算法库中确定出目标强化学习算法；基于目标智能体、智能体配置信息以及目标强化学习算法，构建强化学习模型，并对强化学习模型进行仿真，并将仿真过程中产生的数据存入经验回放池；根据从经验回放池中获取的训练数据以及奖励函数信息对强化学习模型进行训练。本方案极大的降低了用户的使用门槛，充分满足了用户对强化学习环境的多样化需求。

3.

发明授权
一种基于代理模型的仿真模拟方法、装置及电子设备有权

公开(公告)号：CN117215728B

公开(公告)日：2024-03-15

申请号：CN202311464152.2

申请日：2023-11-06

Applicant: 之江实验室

Inventor： 刘冰洁 , 王永恒 , 王超 , 郑宁欣 , 黄志源 , 张杨 , 董世海 , 连建晓 , 曾洪海 , 邵彬 , 李磊

IPC: G06F9/455 , G06F18/214 , G06N3/0464

Abstract: 本说明书公开了一种基于代理模型的仿真模拟方法、装置及电子设备。所述方法包括：将历史业务数据输入仿真模型，得到每个历史业务数据对应的目标仿真结果；确定仿真模型对应的若干种代理模型，代理模型包括：高斯过程模型、神经网络模型、克里金模型以及插值模型；根据历史业务数据以及目标仿真结果，生成训练样本对各代理模型进行训练，得到各训练后代理模型，并将各训练后代理模型集成并部署在仿真环境中；在接收到仿真指令后，获取仿真数据；确定用户选择的至少一种训练后代理模型，作为目标代理模型；将仿真数据输入各目标代理模型，以通过各目标代理模型确定仿真模拟结果。

4.

发明授权
一种基于非合作博弈的策略生成方法及装置有权

公开(公告)号：CN117252234B

公开(公告)日：2024-03-01

申请号：CN202311531148.3

申请日：2023-11-16

Applicant: 之江实验室

Inventor： 金星 , 王永恒 , 王超 , 张文浩 , 王震 , 张杨 , 陈卫 , 曾洪海 , 杨亚飞 , 连建晓 , 鲁艺 , 王梦丝

IPC: G06N3/006 , G06N7/01

Abstract: 本说明书公开了一种基于非合作博弈的策略生成方法及装置，通过构建目标用户对应的图数据，针对每个智能体，根据该智能体的被观测概率以及背叛参数，确定该智能体的背叛行为策略。根据各邻居智能体的背叛行为策略和各邻居智能体的被观测概率，通过该智能体的惩罚参数，确定该智能体分别对各邻居智能体的第一惩罚行为策略。进而参考各智能体在背叛行为策略和第一惩罚行为策略的影响下，更新该智能体的背叛参数和惩罚参数，用于确定各智能体的行为策略。从上述方法可以看出，通过构建目标用户对应的图数据，参考了与目标用户相关用户的行为策略的影响，以及实时更新目标用户的惩罚参数和背叛参数，得到的行为策略，更准确、实效性强。(56)对比文件Marco Casari等.Decentralizedmanagement of common property resources:experiments with a centuries-oldinstitution.Journal of Economic Behavior& Organization.2003,全文.裴华艳;闫光辉;王焕民.基于行为惩罚的合作演化研究.兰州交通大学学报.2020,(02),全文.王浩云;张顺颐;赵振东;马燕玲.基于不完全信息博弈的P2P网络节点行为策略模型.应用科学学报.2008,(05),全文.于建业;王元卓;靳小龙;程学旗.基于社交演化博弈的社交网络用户信息分享行为演化分析.电子学报.2018,(01),全文.谢逢洁;武小平;崔文田;陈子凤.博弈参与水平对无标度网络上合作行为演化的影响.中国管理科学.2017,(05),全文.

5.

发明公开
一种基于大语言模型的舆情传播建模仿真和风险预警方法

公开(公告)号：CN117575829A

公开(公告)日：2024-02-20

申请号：CN202311591174.5

申请日：2023-11-24

Applicant: 之江实验室

Inventor： 张杨 , 王超 , 王永恒 , 晁玉珊 , 董世海 , 李磊 , 邵彬 , 肖恒进 , 董子铭 , 杨亚飞 , 韩珺婷

IPC: G06Q50/00 , G06Q10/04 , G06N3/006 , G06N20/00

Abstract: 本说明书公开了一种基于大语言模型的舆情传播建模仿真和风险预警方法，可以获取事件舆情信息，并根据该事件舆情信息对预设的大语言模型进行微调训练，而后，可以初始化拓扑网络，并初始化智能体的自身特征，在每一轮迭代中，确定智能体的记忆流信息，并从记忆流信息中筛选出目标信息，将上一轮迭代中更新得到的自身特征以及所述目标信息输入到所述大语言模型，得到本轮迭代中更新得到的自身特征，将本轮迭代中更新得到的自身特征输入到大语言模型中，得到预测出的智能体针对目标事件的行为信息，并更新所述拓扑网络，以进行下一轮迭代。最后，可以根据每一轮迭代中预测得到的各智能体的行为信息，进行风险预警。

6.

发明授权
一种强化学习模型构建方法、装置、存储介质及电子设备有权

公开(公告)号：CN117035122B

公开(公告)日：2024-01-26

申请号：CN202311293168.1

申请日：2023-10-08

Applicant: 之江实验室

Inventor： 王永恒 , 董子铭 , 曾洪海 , 肖恒进 , 巫英才 , 王超 , 陈卫 , 邵彬 , 韩珺婷 , 鲁艺 , 金星 , 张杨

IPC: G06N20/00

Abstract: 本说明书公开了一种强化学习模型构建方法、装置、存储介质及电子设备。可以通过指定强化学习模型框架中为用户提供的各种类型不同的组件，使得用户仅需要选择组件、配置组件初始的参数和变量、编辑函数体组件中的逻辑、配置行为时间规则后，通过触发JEP执行器运行代码从而训练用户定义的强化学习模型，从而可以提升用户构建强化学习模型的效率。

7.

发明公开
一种确定电能资源分配策略的方法、装置及设备审中-实审

公开(公告)号：CN117371718A

公开(公告)日：2024-01-09

申请号：CN202311342169.0

申请日：2023-10-16

Applicant: 之江实验室

Inventor： 张杨 , 王永恒 , 王超 , 邵彬 , 刘冰洁 , 董世海 , 韩珺婷 , 曾洪海 , 连建晓 , 肖恒进 , 金星

IPC: G06Q10/0631 , G06Q50/06 , G06N3/008

Abstract: 在本说明书提供的一种确定电能资源分配策略的方法、装置及设备中，通过设置充电站智能体和电动汽车智能体的交互环境，针对每个智能体，根据当前状态信息，确定其第一行为策略，以及根据该第一行为策略确定第一评估结果，根据各智能体已确定的各个体收益值，量化各智能体间的相关性，并参考该智能体与其他智能体的相关性、各智能体的当前状态信息和第一行为策略及第一评估结果，迭代更新该智能体的第一执行者网络，直至收敛，该第一执行者网络用于确定该智能体的电能资源分配策略。从上述方法可以看出，通过量化智能体间的相关性，考虑了不同智能体间的交互影响，使得通过迭代更新直至收敛的第一执行者网络得到的电能资源分配策略更准确。

8.

发明公开
一种基于非合作博弈的策略生成方法及装置有权

公开(公告)号：CN117252234A

公开(公告)日：2023-12-19

申请号：CN202311531148.3

申请日：2023-11-16

Applicant: 之江实验室

Inventor： 金星 , 王永恒 , 王超 , 张文浩 , 王震 , 张杨 , 陈卫 , 曾洪海 , 杨亚飞 , 连建晓 , 鲁艺 , 王梦丝

IPC: G06N3/006 , G06N7/01

Abstract: 本说明书公开了一种基于非合作博弈的策略生成方法及装置，通过构建目标用户对应的图数据，针对每个智能体，根据该智能体的被观测概率以及背叛参数，确定该智能体的背叛行为策略。根据各邻居智能体的背叛行为策略和各邻居智能体的被观测概率，通过该智能体的惩罚参数，确定该智能体分别对各邻居智能体的第一惩罚行为策略。进而参考各智能体在背叛行为策略和第一惩罚行为策略的影响下，更新该智能体的背叛参数和惩罚参数，用于确定各智能体的行为策略。从上述方法可以看出，通过构建目标用户对应的图数据，参考了与目标用户相关用户的行为策略的影响，以及实时更新目标用户的惩罚参数和背叛参数，得到的行为策略，更准确、实效性强。

9.

发明授权
一种强化学习模型训练和业务执行方法、装置及电子设备有权

公开(公告)号：CN117725985B

公开(公告)日：2024-05-24

申请号：CN202410171178.6

申请日：2024-02-06

Applicant: 之江实验室

Inventor： 张杨 , 王超 , 陈卫 , 陈振宇 , 王永恒 , 郑黄河 , 恽爽 , 曾洪海 , 连建晓 , 王梦丝 , 路游 , 周春来 , 鲁艺

IPC: G06N3/092 , G06F30/27

Abstract: 本说明书公开了一种强化学习模型训练和业务执行方法、装置及电子设备。所述方法包括：获取用户针对指定业务场景构建的强化学习环境数据；响应于用户的指定操作，确定用户基于强化学习环境数据选择的目标智能体，并确定目标智能体的智能体配置信息；在预设算法库中确定出目标强化学习算法；基于目标智能体、智能体配置信息以及目标强化学习算法，构建强化学习模型，并对强化学习模型进行仿真，并将仿真过程中产生的数据存入经验回放池；根据从经验回放池中获取的训练数据以及奖励函数信息对强化学习模型进行训练。本方案极大的降低了用户的使用门槛，充分满足了用户对强化学习环境的多样化需求。

10.

发明授权
一种结合深度学习与因果推断的网络舆情分析方法及装置有权

公开(公告)号：CN117494068B

公开(公告)日：2024-04-19

申请号：CN202311546925.1

申请日：2023-11-17

Applicant: 之江实验室

Inventor： 王超 , 王永恒 , 金星 , 王靖锐 , 王震 , 邵彬 , 张杨 , 董世海 , 恽爽 , 路游 , 杨亚飞 , 鲁艺 , 周春来

IPC: G06F18/27 , G06F18/241 , G06F18/2321 , G06N7/01 , G06N3/045 , G06N3/08 , G06T11/20

Abstract: 本说明书实施例提供的一种结合深度学习与因果推断的网络舆情分析方法及装置，确定目标事件，确定与所述目标事件相关的待分析事件和影响所述目标事件的网络舆情的相关事件，根据所述相关事件，构建所述相关事件的时间序列数据集，获取所述目标事件的网络舆情数据，将所述网络舆情数据输入到预先训练的分析模型，得到所述网络舆情的情感倾向表征值，根据所述时间序列数据集和所述情感倾向表征值，拟合所述情感倾向表征值关于所述时间序列数据集的曲线，根据所述待分析事件的发生时刻以及所述曲线，确定所述待分析事件对网络舆情的影响。通过该方法，在对网络舆情进行分析的基础上，确定了所述待分析事件是否对所述网络舆情产生影响。

Search Results

Country/Region

Patent validity

Application date

Publication (announcement) day

applicant

The country/region where the applicant is located

Inventor

IPC

IPC Department

IPC class

IPC subclass

IPC group

IPC team

Appearance classification