模型优化方法、装置、电子设备和计算机可读存储介质

    公开(公告)号:CN119647551A

    公开(公告)日:2025-03-18

    申请号:CN202411483690.0

    申请日:2024-10-23

    Applicant: 吉林大学

    Abstract: 本申请提供了一种模型优化方法、装置、电子设备和计算机可读存储介质,涉及强化学习技术领域,本申请提供的模型优化方法通过从智能体与环境以往交互所产生的历史策略经验中筛选出高质量的历史策略经验,然后利用高质量的历史策略经验和由总变差距离构建得到奖励函数优化智能体所采用的策略,不仅能够在强化学习中提高历史经验样本的利用率,并且还能够减少强化学习中智能体与环境交互所需的成本和时间,并且引入的奖励函数可以将策略差异作为负奖励,从而限制策略更新的幅度,有利于确保策略的稳定性。

    基于子空间学习的神经网络训练方法、装置和电子设备

    公开(公告)号:CN119672458A

    公开(公告)日:2025-03-21

    申请号:CN202411619943.2

    申请日:2024-11-13

    Applicant: 吉林大学

    Abstract: 本申请提供了一种基于子空间学习的神经网络训练方法、装置和电子设备,涉及计算机技术领域,该方法包括:获取第一样本图像对应的第一融合图像,第一融合图像由第一样本图像和视觉提示模块输出的第一视觉提示融合得到,将第一融合图像输入图像处理模块得到第一输出结果,采用子空间学习将第一损失转换为调整向量,根据调整向量对视觉提示模块中的向量进行调整,迭代上述步骤,在达到第一结束条件时,得到由图像处理模块和调整后的视觉提示模块组合而成的神经网络。本申请提供的训练方法,可以加快神经网络的收敛速度,缩短神经网络的训练时间。

    图节点分类模型的训练方法、装置、存储介质及电子设备

    公开(公告)号:CN118606813A

    公开(公告)日:2024-09-06

    申请号:CN202410556580.6

    申请日:2024-05-07

    Applicant: 吉林大学

    Abstract: 本申请实施例公开了一种图节点分类模型的训练方法、装置、存储介质以及电子设备,所述方法包括:首先对在预设存储空间内的节点数据进行特征提取得到节点数据对应的节点特征向量,然后基于节点特征向量对第一图节点分类模型进行针对欧几里得空间的模型训练处理得到第二图节点分类模型,之后基于第二图节点分类模型对节点特征向量进行节点关系识别得到参考图结构,基于参考图结构进行困惑节点识别处理得到困惑节点数据,而后基于困惑节点数据和参考图结构对第二图节点分类模型进行针对双曲空间的模型训练处理得到目标图节点分类模型。

Patent Agency Ranking