基于强化学习的信道竞争优化方法、系统、设备及介质
摘要:
本发明提供一种基于强化学习的信道竞争优化方法、装置、系统、设备及介质,该方法适用于站点端,包括:当该站点信道竞争失败、或者信道竞争成功但发送数据失败需要重新发送数据时,根据该站点对应的历史状态信息进行强化学习,得到目标随机数范围索引,所述目标随机数范围索引用于指引随机数的选择范围;基于所述目标随机数范围索引,确定随机数的目标选择范围,并从所述目标选择范围中选择一随机数作为回退初始值,以基于所述回退初始值进行信道竞争。本发明能够在保证各站点在统计意义上有均等发送机会的同时,使各站点能够更有效地处理竞争冲突、更快地获取到发送机会,减少由于回退初始值选择偏大、造成空口持续空闲等待回退值回退的时间。
0/0