大语言模型评测方法及装置、电子设备、可读存储介质

    公开(公告)号:CN118364250A

    公开(公告)日:2024-07-19

    申请号:CN202410499728.7

    申请日:2024-04-24

    Abstract: 本公开提供了一种大语言模型评测方法及装置、电子设备、可读存储介质,属于智能对话技术领域,该方法包括:基于第一问题和多个第一追问问题依次对第一语言模型进行静态测试,得到第一语言模型针对于第一问题和多个第一追问问题的第一回复信息;基于第一问题和多个第二追问问题依次对第一语言模型进行动态测试,得到第一语言模型针对于第一问题和多个第二追问问题的第二回复信息;基于第一回复信息和第二回复信息确定第一语言模型的评测结果。本公开提出的静态测试和动态测试结合的评估方法能够更准确地评估模型的多轮对话能力,从而更好地反映模型在真实世界应用中的表现。

    多任务模型训练方法及装置、电子设备、可读存储介质

    公开(公告)号:CN117789005A

    公开(公告)日:2024-03-29

    申请号:CN202410056168.8

    申请日:2024-01-15

    Abstract: 本公开提供了一种多任务模型训练方法及装置、电子设备、可读存储介质,属于多任务决策领域,该方法包括:根据训练任务对训练数据集进行划分,得到多个子数据集;确定每个子数据集对应的任务标签,将每个子数据集对应的任务标签转换为每个子数据集对应的任务掩码;基于每个子数据集对应的任务掩码对多任务模型中的权重参数进行筛选,得到每个子数据集对应的第一权重参数;将多个子数据集依次输入至多任务模型中对多任务模型进行训练。本公开提供的多任务模型训练方法及装置、电子设备、可读存储介质能够根据任务掩码找到多个任务之间的共同特征,从而能够高效利用权重参数,同时使模型的计算开销大的问题得到缓解。

    一种数据集扩充方法及装置

    公开(公告)号:CN118607668B

    公开(公告)日:2025-04-18

    申请号:CN202410830079.4

    申请日:2024-06-25

    Abstract: 本公开提供了一种数据集扩充方法及装置,属于数据处理技术领域,该方法包括:基于第一语言模型生成第一样本数据;将第一样本数据添加至包含有第二样本数据的数据集中,从数据集中筛选出第三样本数据;第二样本数据为真实数据,第三样本数据为第一样本数据中与真实数据的关联度小于第一阈值的数据;基于第四样本数据训练第一语言模型;第四样本数据为数据集中除第三样本数据之外的数据;返回执行基于第一语言模型生成第一样本数据的步骤,直至满足设定条件,得到扩充后的数据集。本公开提供的一种数据集扩充方法及装置能够淘汰低质量样本,优化生成过程,有效保留更加丰富和高质量的样本。

    一种基于通用合作知识的多智能体协作方法

    公开(公告)号:CN119578452A

    公开(公告)日:2025-03-07

    申请号:CN202411655649.7

    申请日:2024-11-19

    Abstract: 本发明公开了一种基于通用合作知识的多智能体协作方法,包括以下步骤:确定任务领域,并选取若干个合作任务;构建多任务训练框架,所述训练框架包括为每一个合作任务设置的感知网络和决策网络,所述决策网络包括共享决策层和任务特定决策层;基于每一个合作任务,对所述多任务训练框架进行训练,基于训练后的决策网络,构建任务共享决策网络模型;将所述任务共享决策网络模型迁移到新的任务领域中进行训练,完成当前任务中多智能体的协作。本发明采用一种多任务的学习方法,通过将学得的共享策略网络应用于其它相同或不同领域的合作任务中进行训练,促进智能体之间的协作和协调。

    基于双层嵌套进化强化学习的智能决策方法及系统

    公开(公告)号:CN119539038A

    公开(公告)日:2025-02-28

    申请号:CN202510096269.2

    申请日:2025-01-22

    Abstract: 本公开提供了一种基于双层嵌套进化强化学习的智能决策方法及系统,该方法包括:基于进化学习算法初始化目标任务场景对应的任务配置种群;任务配置种群包括多个种群个体,每个种群个体均设置有第一配置网络和第一动作网络;多次执行种群优化操作,直至任务配置种群中的精英个体变为固定;基于精英个体对应的第一配置网络和第一动作网络确定目标任务场景的决策结果;种群优化操作包括:计算每个种群个体对应的适应度;基于每个种群个体对应的适应度将多个种群个体划分为精英个体和非精英个体;基于精英个体和强化学习算法更新任务配置种群中的非精英个体。本公开提供的基于双层嵌套进化强化学习的智能决策方法及系统可以提高辅助决策的有效性。

    多智能体强化学习方法及装置、电子设备、存储介质

    公开(公告)号:CN118052272B

    公开(公告)日:2024-11-01

    申请号:CN202410189439.7

    申请日:2024-02-20

    Abstract: 本公开提供了一种多智能体强化学习方法及装置、电子设备、存储介质,属于超图表示学习技术领域,该方法包括:基于多智能体系统中各个智能体的观测信息生成多条超边。每条超边连接多个智能体,多条超边组成超图结构。超图结构为多智能体系统对应的通信结构。基于各个智能体的观测信息计算多智能体之间的消息权重。基于通信结构和消息权重生成多智能体系统对应的关联度。基于关联度对各个智能体的通信信息进行融合,得到每个智能体对应的融合通信信息。融合通信信息用于指导对应智能体的动作。本公开提供的多智能体强化学习方法及装置、电子设备、存储介质能对多个来自不同智能体的异构信息进行通信融合。

Patent Agency Ranking