一种基于PPO模型的混合牵制控制策略改进的DBS系统

    公开(公告)号:CN118675704A

    公开(公告)日:2024-09-20

    申请号:CN202410545537.X

    申请日:2024-05-06

    申请人: 复旦大学

    摘要: 本发明基于PPO和Leader Rank算法,提出了一种基于强化学习的混合牵制策略用于改进DBS系统,该策略旨在通过对特定节点精确地施加脉冲刺激,从而抑制系统整体的同步性并且同时减少对脑神经系统侵入性,以提高治疗帕金森病及其他神经系统疾病的效果和精度。通过Leader Rank算法优化牵制节点的选择,通过PPO算法实现对DBS治疗过程的实时反馈和动态调整,从而提供更为个性化和精确的治疗方案。本发明包含如下步骤:步骤S1,建立一个包含患者特定脑区神经活动数据的强化学习环境;步骤S2,设定PPO模型的状态和动作;步骤S3,设计奖励函数并训练PPO模型实现同步抑制;步骤S4,使用Leader Rank算法计算实现牵制节点选择与优化;步骤S5,混合牵制控制策略实施;步骤S6,计算抑制系数、同步误差、总输出能量是否符合预期,是则进行步骤S7,否则返回步骤S1;步骤S7,将训练好的PPO模型以及混合牵制控制策略集成到带反馈的DBS系统中。

    一种基于高阶网络储备池计算系统的时间序列预测方法

    公开(公告)号:CN118396057A

    公开(公告)日:2024-07-26

    申请号:CN202410488272.4

    申请日:2024-04-23

    申请人: 复旦大学

    发明人: 普笛 冷思阳 关春

    IPC分类号: G06N3/0499 G06N3/08

    摘要: 一种基于高阶网络的储备池计算系统,包括输入层、高阶网络储备池层和输出层,其中在输入层内基于预设的输入序列的维度和高阶网络储备池层的大小构建输入矩阵Win,矩阵中元素的值随机确定并服从均值为0、方差为1的正态分布;在高阶网络储备池层内基于预设的高阶网络储备池层的大小构建状态向量,向量中元素的值初始化为0;高阶网络储备池层内结点的连接矩阵W基于一个随机生成的超图的关联矩阵H确定,其中每条超边的权重随机确定并服从均值为0、方差为1的正态分布;在输出层内基于预设的高阶网络储备池层的大小和预测序列的维度构建输出矩阵Wout,矩阵中元素的值初始化为0待训练后确定。