基于深度强化学习的微电网优化能量管理系统
Abstract:
本发明公开了基于深度强化学习的微电网优化能量管理系统,采用DRL中的Soft Actor‑Critic(SAC算法,通过使用softmax函数将离散动作转换为概率分布,然后将概率分布映射到实数空间,同时实现了离散化动作空间集的控制,所述SAC的具体训练过程包括采样数据、计算Q值、更新策略、更新值函数、以及更新目标策略,本发明对于复杂任务具有很强的表现能力:深度强化学习通过使用深度神经网络等模型,能够对复杂环境和任务进行建模,从而学习到更加高层次的特征和表示。
Patent Agency Ranking
0/0