一种基于Q学习算法的网络选择方法
摘要:
本发明公开了一种基于Q学习算法的网络选择方法,包括以下几个步骤:(1)初始化Q值表,设置折扣因子γ和学习率α;(2)确定设定时刻到达业务的类型k和当前两个网络的负载率BWi,得到当前的状态sn;(3)在动作集合A中选择可用动作,并记录该动作以及下一个网络状态sn+1;(4)根据执行选择动作后的网络状态,计算立即回报函数r;(5)更新Q值函数Qn(s,a),学习率α按照反比例函数规律逐渐减小为0;(6)重复步骤(2)-(5),直至Q值收敛,即更新前后Q值差值小于门限值;(7)返回步骤(3)选择动作,接入最佳网络。本发明能有效降低语音业务阻塞率和数据业务丢包率,提高网络平均吞吐量。
公开/授权文献
0/0