-
公开(公告)号:CN119962630A
公开(公告)日:2025-05-09
申请号:CN202510362211.8
申请日:2025-03-26
Applicant: 华北电力大学(保定)
IPC: G06N3/096 , G06N3/0464 , G06N3/047
Abstract: 本发明公开了一种基于经验回放的持续学习方法、装置、终端、存储介质和计算机程序产品,该方法包括:获取人工智能体的内存中缓冲区中的数据,记为缓冲数据;并获取人工智能体的当前任务数据;采用UIS策略作为抽样策略,自缓冲数据中抽取样本,作为代表样本;基于代表样本进行UIR重放和双网络学习,得到LALL数据;双网络,包括:CNN网络和BNN网络;基于当前任务数据,经BNN网络学习后,得到Mprobs数据;基于LALL数据、以及Mprobs数据,更新人工智能体的内存中缓冲区中的数据,以实现人工智能体的持续学习。该方案,通过不确定性集成暗经验重放模型,在学习了新任务后保持之前任务的性能,确保稳健性和多样性。
-
公开(公告)号:CN119962631A
公开(公告)日:2025-05-09
申请号:CN202510362233.4
申请日:2025-03-26
Applicant: 华北电力大学(保定)
Abstract: 本发明公开了一种基于关系回放的持续学习方法、装置、终端、存储介质和计算机程序产品,该方法包括:利用当前任务输入的数据对存储在缓冲区中的先前任务样本进行更新后,获取先前任务训练样本;基于先前任务训练样本的数据,进行回放操作、数据增强操作后利用神经网络、经验回放模块、实例协同学习模块和类别协同学习模块进行训练得到第一数据;基于当前任务输入的数据进行数据增强操作后,利用神经网络进行训练得到第二数据;基于第一数据和第二数据确定目标函数,作为持续学习模型。该方案,通过结合神经网络、经验回放模块、实例协同学习模块和类别协同学习模块进行训练,以结合不同实例之间的相关性知识进行保存,避免灾难性遗忘。
-