发明公开
- 专利标题: 一种基于Q学习算法的网络选择方法
- 专利标题(英): Network selection method based on Q-learning algorithm
-
申请号: CN201710915293.X申请日: 2017-09-30
-
公开(公告)号: CN107690176A公开(公告)日: 2018-02-13
- 发明人: 李洋 , 冯宝 , 刘金锁 , 赵高峰 , 张立武 , 蔡世龙 , 刘文贵 , 完颜绍澎 , 卞宇翔 , 马涛 , 丁晨阳 , 胡阳 , 蒯本链
- 申请人: 南京南瑞集团公司 , 南京南瑞信息通信科技有限公司
- 申请人地址: 江苏省南京市鼓楼区南瑞路8号
- 专利权人: 南京南瑞集团公司,南京南瑞信息通信科技有限公司
- 当前专利权人: 南京南瑞集团公司,南京南瑞信息通信科技有限公司
- 当前专利权人地址: 江苏省南京市鼓楼区南瑞路8号
- 代理机构: 南京纵横知识产权代理有限公司
- 代理商 姚兰兰; 董建林
- 主分类号: H04W48/18
- IPC分类号: H04W48/18 ; H04W24/06
摘要:
本发明公开了一种基于Q学习算法的网络选择方法,包括以下几个步骤:(1)初始化Q值表,设置折扣因子γ和学习率α;(2)确定设定时刻到达业务的类型k和当前两个网络的负载率BWi,得到当前的状态sn;(3)在动作集合A中选择可用动作,并记录该动作以及下一个网络状态sn+1;(4)根据执行选择动作后的网络状态,计算立即回报函数r;(5)更新Q值函数Qn(s,a),学习率α按照反比例函数规律逐渐减小为0;(6)重复步骤(2)-(5),直至Q值收敛,即更新前后Q值差值小于门限值;(7)返回步骤(3)选择动作,接入最佳网络。本发明能有效降低语音业务阻塞率和数据业务丢包率,提高网络平均吞吐量。
公开/授权文献
- CN107690176B 一种基于Q学习算法的网络选择方法 公开/授权日:2020-08-25