-
公开(公告)号:CN110191472B
公开(公告)日:2022-09-27
申请号:CN201910439379.9
申请日:2019-05-24
Applicant: 杭州电子科技大学
IPC: H04W16/14 , H04W16/22 , H04W72/04 , H04W72/08 , H04B17/382
Abstract: 本发明公开了一种基于改进多目标混沌PSO优化的目标信道访问方法。首先要将信道访问顺序转化为粒子位置,将信道序号编码成离散二进制[0,1]序列后进行纠正编码。然后引入倒“S”型函数改进惯性权重递减更新方式来改进粒子速度更新方法,引入“V”型函数更新粒子位置,将累积时延和信道容量作为目标函数,根据Pareto支配的定义,确定非支配解并加入到外部集中。使用自适应网格从外部集中选择全局最优解并对其进行基于改进Tent映射的混沌优化。当达到最大迭代次数,输出外部集里的解,每个解均对应一种目标信道访问顺序,这些解都是Pareto最优解。本发明复杂度较低,帮助算法收敛,有效跳出局部最优解。
-
公开(公告)号:CN113411099A
公开(公告)日:2021-09-17
申请号:CN202110593616.4
申请日:2021-05-28
Applicant: 杭州电子科技大学
Abstract: 本发明公开了一种基于PPER‑DQN的双变跳频图案智能决策方法。针对待优化的双变跳频图案的主要参数,设计了相应的系统模型、状态‑动作空间和奖励函数,采用DQN算法进行决策,使用户的使用频段能出现在可用频段内的任意位置,从而提高跳频图案的灵活性。根据Pareto支配的定义提出以样本的时序差分误差和立即奖励为依据的样本优先经验回放技术,以提高样本利用率和经验回放效率。使用Pareto样本集和随机采样的样本形成训练集,以保证训练集样本多样性。本发明方法有效提高了经验回放效率和收敛速度,产生的双变跳频图案较常规跳频图案性能更优。
-
公开(公告)号:CN112543038B
公开(公告)日:2022-03-11
申请号:CN202011203291.6
申请日:2020-11-02
Applicant: 杭州电子科技大学
IPC: H04B1/715
Abstract: 本发明公开了一种基于HAQL‑PSO的跳频系统智能抗干扰决策方法。本发明将全局和个体最优解的引导机制引入Q学习过程,设计启发式函数用于动作选择策略;将Sigmoid函数用于启发式Q学习中;针对跳频通信中可能出现的干扰及可调节的参数,设计了状态‑动作空间及奖励函数。然后根据频谱感知结果预测未来短时间内的频谱状态。在初始化Q值、启发式函数、其他参数及初始状态后,根据动作选择策略选择最佳动作并执行,得到下一状态。对于当前的状态和动作计算奖赏函数并更新启发式函数和Q值。当达到总迭代次数时,结束学习,获得Q表用于指导参数调整,否则,更新状态和温度参数并进入下一次迭代。本发明解决了Q学习中探索和利用的平衡问题。
-
公开(公告)号:CN112543038A
公开(公告)日:2021-03-23
申请号:CN202011203291.6
申请日:2020-11-02
Applicant: 杭州电子科技大学
IPC: H04B1/715
Abstract: 本发明公开了一种基于HAQL‑PSO的跳频系统智能抗干扰决策方法。本发明将全局和个体最优解的引导机制引入Q学习过程,设计启发式函数用于动作选择策略;将Sigmoid函数用于启发式Q学习中;针对跳频通信中可能出现的干扰及可调节的参数,设计了状态‑动作空间及奖励函数。然后根据频谱感知结果预测未来短时间内的频谱状态。在初始化Q值、启发式函数、其他参数及初始状态后,根据动作选择策略选择最佳动作并执行,得到下一状态。对于当前的状态和动作计算奖赏函数并更新启发式函数和Q值。当达到总迭代次数时,结束学习,获得Q表用于指导参数调整,否则,更新状态和温度参数并进入下一次迭代。本发明解决了Q学习中探索和利用的平衡问题。
-
公开(公告)号:CN110191472A
公开(公告)日:2019-08-30
申请号:CN201910439379.9
申请日:2019-05-24
Applicant: 杭州电子科技大学
IPC: H04W16/14 , H04W16/22 , H04W72/04 , H04W72/08 , H04B17/382
Abstract: 本发明公开了一种基于改进多目标混沌PSO优化的目标信道访问方法。首先要将信道访问顺序转化为粒子位置,将信道序号编码成离散二进制[0,1]序列后进行纠正编码。然后引入倒“S”型函数改进惯性权重递减更新方式来改进粒子速度更新方法,引入“V”型函数更新粒子位置,将累积时延和信道容量作为目标函数,根据Pareto支配的定义,确定非支配解并加入到外部集中。使用自适应网格从外部集中选择全局最优解并对其进行基于改进Tent映射的混沌优化。当达到最大迭代次数,输出外部集里的解,每个解均对应一种目标信道访问顺序,这些解都是Pareto最优解。本发明复杂度较低,帮助算法收敛,有效跳出局部最优解。
-
公开(公告)号:CN109259528A
公开(公告)日:2019-01-25
申请号:CN201811140558.4
申请日:2018-09-28
Applicant: 杭州电子科技大学
Abstract: 本发明公开了一种基于人脸识别与肤质检测的家居智能镜子。本发明包括固定壳体、显示界面、摄像头、温度传感器、控制装置;固定壳体内部设置有温度传感器和控制装置;显示界面包括显示屏和原子镜,原子镜设置在固定壳体外,显示屏设置在固定壳体内,与控制装置相连,且与原子镜相邻设置;显示界面利用原子镜单向透光的原理,通过显示屏和原子镜的叠加,将信息显示在原子镜上;通过对显示屏的控制,使得前面原子镜处于普通镜子状态亦或是镜子状态下。本发明增加了镜子的实用性,可应用于客厅、浴室、梳妆台、线下体验门店等场景,和市面上现有智能镜子相比,具有人脸识别速度更快、能进行肤质诊断、可提供定制化的肤质保养方等优点。
-
公开(公告)号:CN113824469A
公开(公告)日:2021-12-21
申请号:CN202110896680.X
申请日:2021-08-05
Applicant: 杭州电子科技大学
Abstract: 本发明公开了一种基于MFDRL‑CTDE的跳频组网智能抗干扰决策方法。针对多种干扰并存的复杂电磁环境和跳频异步组网结构,设计了相应的状态‑动作空间和奖赏函数。为应对Agent之间的相互影响和动态的环境,引入集中式训练和分散式执行框架。提出基于模糊推理系统的融合权重分配策略,用于解决网络融合过程中各Agent的权重分配问题。采用竞争性DQN算法和优先经验回放技术以提高算法的效率。本发明方法在收敛速度和最佳性能方面都具有较大优势,且对多变复杂电磁环境具有较好的适应性。
-
公开(公告)号:CN113824469B
公开(公告)日:2022-10-21
申请号:CN202110896680.X
申请日:2021-08-05
Applicant: 杭州电子科技大学
Abstract: 本发明公开了一种基于MFDRL‑CTDE的跳频组网智能抗干扰决策方法。针对多种干扰并存的复杂电磁环境和跳频异步组网结构,设计了相应的状态‑动作空间和奖赏函数。为应对Agent之间的相互影响和动态的环境,引入集中式训练和分散式执行框架。提出基于模糊推理系统的融合权重分配策略,用于解决网络融合过程中各Agent的权重分配问题。采用竞争性DQN算法和优先经验回放技术以提高算法的效率。本发明方法在收敛速度和最佳性能方面都具有较大优势,且对多变复杂电磁环境具有较好的适应性。
-
公开(公告)号:CN113411099B
公开(公告)日:2022-04-29
申请号:CN202110593616.4
申请日:2021-05-28
Applicant: 杭州电子科技大学
Abstract: 本发明公开了一种基于PPER‑DQN的双变跳频图案智能决策方法。针对待优化的双变跳频图案的主要参数,设计了相应的系统模型、状态‑动作空间和奖励函数,采用DQN算法进行决策,使用户的使用频段能出现在可用频段内的任意位置,从而提高跳频图案的灵活性。根据Pareto支配的定义提出以样本的时序差分误差和立即奖励为依据的样本优先经验回放技术,以提高样本利用率和经验回放效率。使用Pareto样本集和随机采样的样本形成训练集,以保证训练集样本多样性。本发明方法有效提高了经验回放效率和收敛速度,产生的双变跳频图案较常规跳频图案性能更优。
-
-
-
-
-
-
-
-