一种RAN切片与MAC调度联合智能优化方法

    公开(公告)号:CN116963127A

    公开(公告)日:2023-10-27

    申请号:CN202310913684.3

    申请日:2023-07-24

    Applicant: 东南大学

    Abstract: 本发明公开一种RAN切片与MAC调度联合智能优化方法,应用于多切片多用户上行通信场景,至少包含:构建以最大化长期系统效用为目标的多时间尺度分层架构模型;构建大时间尺度深度强化学习以训练生成切片级RB资源分配策略,新型奖励剪辑方法以在轻量化系统中保障收敛性能,流量感知模块指导经验池采样加速收敛;构建小时间尺度各切片深度强化学习,训练生成各切片差异化MAC调度器超参策略;各切片在每个调度时隙按调度优先级分配RB资源至用户;双时间尺度深度强化学习交替训练至收敛。本发明充分利用强化学习在复杂系统的寻优能力,显著提升不同类型切片SLA满足率和系统频谱效率,有效实现高系统效用、轻量化、高鲁棒性的多切片多用户通信系统。

Patent Agency Ranking