-
公开(公告)号:CN118153629B
公开(公告)日:2025-02-11
申请号:CN202410249830.1
申请日:2024-03-05
Applicant: 北京邮电大学
IPC: G06N3/0455 , G06N3/0985
Abstract: 本公开提供了一种智能决策方法及装置、电子设备、可读存储介质,该方法包括:基于第一任务的决策知识信息确定所述第一任务对应的模型参数;基于所述模型参数对决策模型的网络参数进行调整;所述决策模型为第二任务的决策模型;所述网络参数调整后的决策模型用于任务决策。本公开提供的智能决策方法及装置、电子设备、可读存储介质可以提高智能体在新决策任务中决策的准确性。
-
公开(公告)号:CN118092764B
公开(公告)日:2024-12-06
申请号:CN202410274114.9
申请日:2024-03-11
Applicant: 北京邮电大学
IPC: G06F3/0486 , G06F3/04812 , G06F3/0488 , G06N3/09
Abstract: 本公开提供了一种大语言模型指导的智能体动作控制方法及装置,属于人工智能领域,该方法包括:基于大语言模型将目标任务转换为智能体的目标动作序列;将目标动作序列输入至第一智能体控制模型中以实现智能体的控制。本公开提供的一种大语言模型指导的智能体动作控制方法及装置,以解决目前智能体控制的精准性差的问题。
-
公开(公告)号:CN118364250A
公开(公告)日:2024-07-19
申请号:CN202410499728.7
申请日:2024-04-24
Applicant: 北京邮电大学
IPC: G06F18/21 , G06F16/332
Abstract: 本公开提供了一种大语言模型评测方法及装置、电子设备、可读存储介质,属于智能对话技术领域,该方法包括:基于第一问题和多个第一追问问题依次对第一语言模型进行静态测试,得到第一语言模型针对于第一问题和多个第一追问问题的第一回复信息;基于第一问题和多个第二追问问题依次对第一语言模型进行动态测试,得到第一语言模型针对于第一问题和多个第二追问问题的第二回复信息;基于第一回复信息和第二回复信息确定第一语言模型的评测结果。本公开提出的静态测试和动态测试结合的评估方法能够更准确地评估模型的多轮对话能力,从而更好地反映模型在真实世界应用中的表现。
-
公开(公告)号:CN118153629A
公开(公告)日:2024-06-07
申请号:CN202410249830.1
申请日:2024-03-05
Applicant: 北京邮电大学
IPC: G06N3/0455 , G06N3/0985
Abstract: 本公开提供了一种智能决策方法及装置、电子设备、可读存储介质,该方法包括:基于第一任务的决策知识信息确定所述第一任务对应的模型参数;基于所述模型参数对决策模型的网络参数进行调整;所述决策模型为第二任务的决策模型;所述网络参数调整后的决策模型用于任务决策。本公开提供的智能决策方法及装置、电子设备、可读存储介质可以提高智能体在新决策任务中决策的准确性。
-
公开(公告)号:CN117789005A
公开(公告)日:2024-03-29
申请号:CN202410056168.8
申请日:2024-01-15
Applicant: 北京邮电大学
IPC: G06V10/82 , G06N3/0464 , G06N3/08
Abstract: 本公开提供了一种多任务模型训练方法及装置、电子设备、可读存储介质,属于多任务决策领域,该方法包括:根据训练任务对训练数据集进行划分,得到多个子数据集;确定每个子数据集对应的任务标签,将每个子数据集对应的任务标签转换为每个子数据集对应的任务掩码;基于每个子数据集对应的任务掩码对多任务模型中的权重参数进行筛选,得到每个子数据集对应的第一权重参数;将多个子数据集依次输入至多任务模型中对多任务模型进行训练。本公开提供的多任务模型训练方法及装置、电子设备、可读存储介质能够根据任务掩码找到多个任务之间的共同特征,从而能够高效利用权重参数,同时使模型的计算开销大的问题得到缓解。
-
公开(公告)号:CN118607668B
公开(公告)日:2025-04-18
申请号:CN202410830079.4
申请日:2024-06-25
IPC: G06N20/00 , G06F18/214 , G06N3/08 , G06N3/0455 , G06F16/353 , G06F40/30
Abstract: 本公开提供了一种数据集扩充方法及装置,属于数据处理技术领域,该方法包括:基于第一语言模型生成第一样本数据;将第一样本数据添加至包含有第二样本数据的数据集中,从数据集中筛选出第三样本数据;第二样本数据为真实数据,第三样本数据为第一样本数据中与真实数据的关联度小于第一阈值的数据;基于第四样本数据训练第一语言模型;第四样本数据为数据集中除第三样本数据之外的数据;返回执行基于第一语言模型生成第一样本数据的步骤,直至满足设定条件,得到扩充后的数据集。本公开提供的一种数据集扩充方法及装置能够淘汰低质量样本,优化生成过程,有效保留更加丰富和高质量的样本。
-
公开(公告)号:CN119578452A
公开(公告)日:2025-03-07
申请号:CN202411655649.7
申请日:2024-11-19
Applicant: 北京邮电大学
IPC: G06N3/006 , G06N3/0442 , G06N3/092
Abstract: 本发明公开了一种基于通用合作知识的多智能体协作方法,包括以下步骤:确定任务领域,并选取若干个合作任务;构建多任务训练框架,所述训练框架包括为每一个合作任务设置的感知网络和决策网络,所述决策网络包括共享决策层和任务特定决策层;基于每一个合作任务,对所述多任务训练框架进行训练,基于训练后的决策网络,构建任务共享决策网络模型;将所述任务共享决策网络模型迁移到新的任务领域中进行训练,完成当前任务中多智能体的协作。本发明采用一种多任务的学习方法,通过将学得的共享策略网络应用于其它相同或不同领域的合作任务中进行训练,促进智能体之间的协作和协调。
-
公开(公告)号:CN119539038A
公开(公告)日:2025-02-28
申请号:CN202510096269.2
申请日:2025-01-22
Applicant: 北京邮电大学
Abstract: 本公开提供了一种基于双层嵌套进化强化学习的智能决策方法及系统,该方法包括:基于进化学习算法初始化目标任务场景对应的任务配置种群;任务配置种群包括多个种群个体,每个种群个体均设置有第一配置网络和第一动作网络;多次执行种群优化操作,直至任务配置种群中的精英个体变为固定;基于精英个体对应的第一配置网络和第一动作网络确定目标任务场景的决策结果;种群优化操作包括:计算每个种群个体对应的适应度;基于每个种群个体对应的适应度将多个种群个体划分为精英个体和非精英个体;基于精英个体和强化学习算法更新任务配置种群中的非精英个体。本公开提供的基于双层嵌套进化强化学习的智能决策方法及系统可以提高辅助决策的有效性。
-
公开(公告)号:CN119417964A
公开(公告)日:2025-02-11
申请号:CN202411461404.0
申请日:2024-10-18
Applicant: 北京邮电大学
IPC: G06T15/00 , G06T5/50 , G06T5/60 , G06V10/44 , G06V10/80 , G06V10/82 , G06N3/0464 , G06N3/0475 , G06N3/045 , G06N3/094
Abstract: 本发明公开了一种基于空间融合的高斯溅射通用渲染增强方法,包括以下步骤:获取待处理的真实图像;构建高斯溅射风格的退化模拟器,并在所述退化模拟器中加入门控机制,选择图像退化过程中的退化类型,生成训练数据集;将待处理的真实图像输入到所述退化模拟器中,生成训练图像;构建高斯增强器,所述高斯增强器利用空间信息融合网络,通过视图融合模块和深度调制模块分别对所述训练图像进行特征融合和增强渲染的处理,生成最终增强结果。本发明可以混合高度相关、高质量的训练图像,并利用目标图像的深度信息来完成渲染细节,从而提高图像的输出渲染质量。
-
公开(公告)号:CN118052272B
公开(公告)日:2024-11-01
申请号:CN202410189439.7
申请日:2024-02-20
Applicant: 北京邮电大学
IPC: G06N3/092 , G06N20/00 , G06N3/042 , G06F18/23 , G06F18/2413
Abstract: 本公开提供了一种多智能体强化学习方法及装置、电子设备、存储介质,属于超图表示学习技术领域,该方法包括:基于多智能体系统中各个智能体的观测信息生成多条超边。每条超边连接多个智能体,多条超边组成超图结构。超图结构为多智能体系统对应的通信结构。基于各个智能体的观测信息计算多智能体之间的消息权重。基于通信结构和消息权重生成多智能体系统对应的关联度。基于关联度对各个智能体的通信信息进行融合,得到每个智能体对应的融合通信信息。融合通信信息用于指导对应智能体的动作。本公开提供的多智能体强化学习方法及装置、电子设备、存储介质能对多个来自不同智能体的异构信息进行通信融合。
-
-
-
-
-
-
-
-
-