-
公开(公告)号:CN119004093A
公开(公告)日:2024-11-22
申请号:CN202310565496.6
申请日:2023-05-18
Applicant: 中国移动通信有限公司研究院 , 东南大学 , 中国移动通信集团有限公司
IPC: G06F18/214 , G06F18/24 , G06F16/215 , G06N3/04 , G06N3/092
Abstract: 本申请公开了一种模型训练方法、设备及可读存储介质,属于通信技术领域,该方法包括:根据第一策略获取第一数据;通过第一数据对初始模型进行训练,得到预训练模型;从网络获取第二数据;通过第二数据对所述预训练模型进行训练,得到目标模型;其中,所述第一策略是预先设定的策略,所述第一数据为离线数据,所述第二数据为在线数据。
-
公开(公告)号:CN116963127A
公开(公告)日:2023-10-27
申请号:CN202310913684.3
申请日:2023-07-24
Applicant: 东南大学
IPC: H04W24/02 , H04W72/0457 , H04W72/56 , H04W72/0446 , G06N3/092 , G06N3/048 , H04L101/622
Abstract: 本发明公开一种RAN切片与MAC调度联合智能优化方法,应用于多切片多用户上行通信场景,至少包含:构建以最大化长期系统效用为目标的多时间尺度分层架构模型;构建大时间尺度深度强化学习以训练生成切片级RB资源分配策略,新型奖励剪辑方法以在轻量化系统中保障收敛性能,流量感知模块指导经验池采样加速收敛;构建小时间尺度各切片深度强化学习,训练生成各切片差异化MAC调度器超参策略;各切片在每个调度时隙按调度优先级分配RB资源至用户;双时间尺度深度强化学习交替训练至收敛。本发明充分利用强化学习在复杂系统的寻优能力,显著提升不同类型切片SLA满足率和系统频谱效率,有效实现高系统效用、轻量化、高鲁棒性的多切片多用户通信系统。
-