一种感知行动回路决策的内在奖励生成方法

    公开(公告)号:CN115587615A

    公开(公告)日:2023-01-10

    申请号:CN202211292921.0

    申请日:2022-10-21

    Abstract: 本发明属于计算机应用技术领域,具体涉及一种感知行动回路决策的内在奖励生成方法。本发明中,首先,搭建状态预测网络,并收集智能体训练过程中的环境状态与智能体动作数据对环境状态变化进行预测建模。其次,在强化学习训练过程中利用已训练的状态预测网络模型预测环境状态变化并生成预测差内在奖励。最后,将生成的预测差内在奖励与外部奖励结合,形成新的奖励以供策略更新网络使用。本发明构建SGBRT网络对环境状态进行预测并生成内在奖励,且利用内在奖励以加快策略更新网络的训练过程并提高训练效果。

    面向医学植入式设备的电磁干扰下跨介质信道建模方法

    公开(公告)号:CN117294374A

    公开(公告)日:2023-12-26

    申请号:CN202311231909.3

    申请日:2023-09-22

    Abstract: 本发明属于计算机应用技术领域,具体涉及一种面向医学植入式设备的电磁干扰下跨介质信道建模方法。本发明中,首先,明确人体各组织在2.4GHz频率附近的介电常数,设置精细人体体素模型。其次,采用时域有限积分法对2.4GHz信号的人体内至体外无线信道进行建模,利用大量仿真实验数据对提出的路径损耗模型进行参数拟合。最后,在新型植入式医疗设备无线通信系统中,计算多源干扰情况下的信干噪比,将其作为植入式医疗设备功率自调节的参考指标。本发明利用该路径损耗模型分析了多源干扰下植入式医疗设备无线通信系统的信干噪比,对新型低功耗植入式医疗设备功率自调节模块实现、天线设计等工作具有指导意义。

Patent Agency Ranking