-
公开(公告)号:CN111260040A
公开(公告)日:2020-06-09
申请号:CN202010370070.1
申请日:2020-05-06
Applicant: 哈尔滨工业大学(深圳)(哈尔滨工业大学深圳科技创新研究院)
Abstract: 本发明提供了一种基于内在奖励的视频游戏决策方法,包括以下步骤:S1、获取视频游戏模拟环境;S2、构建神经网络模型;S3、设计内在奖励模型;S4、将内在奖励模型与构建的神经网络模型结构结合;S5、通过模拟环境获取游戏的记录;S6、通过获取的游戏记录,更新神经网络模型;S7、循环训练神经网络模型直至收敛。本发明的有益效果是:较好的解决了三维场景中较为常见的缺乏环境反馈奖励值的问题。
-
公开(公告)号:CN117095243B
公开(公告)日:2024-05-07
申请号:CN202311345466.0
申请日:2023-10-18
Applicant: 哈尔滨工业大学(深圳)(哈尔滨工业大学深圳科技创新研究院)
IPC: G06V10/764 , H04L9/40 , G06V10/774 , G06V10/80 , G06V10/82 , G06V10/70 , G06V10/74 , G06F18/213 , G06F18/214 , G06F18/22 , G06F18/24 , G06F18/25 , G06F18/20 , G06N3/045 , G06N3/0895 , G06N3/096 , G06N3/084 , G06N3/0985 , G06F123/02
Abstract: 本发明提供一种基于分支融合策略的小样本类增量网络入侵检测方法,包括:步骤一:将采集到的网络流量样本进行拆分处理,处理后的网络流量样本被转化为灰度图像表示;步骤二:将网络流量样本的灰度图像输入到骨干网络ViT中用于自监督模式的预训练以提高特征嵌入的表示能力;步骤三:初始化基础会话分支分类器的投影层参数,用于训练初始的检测分类模型;步骤四:学习每个新会话分支分类器模块,进而使用分支融合策略关联基础会话和新会话分支分类器从而帮助分类器模型完成训练和推理。本发明的有益效果是:本发明方法在不会遗忘已学习攻击类别的情况下,允许以增量、小样本、灵活的方式持续学习新攻击类别,实现保护目标网络系统免受恶意攻击。
-
公开(公告)号:CN114418098A
公开(公告)日:2022-04-29
申请号:CN202210255131.9
申请日:2022-03-16
Applicant: 哈尔滨工业大学(深圳)(哈尔滨工业大学深圳科技创新研究院)
Abstract: 本发明提供一种神经网络差量压缩方法、装置、电子设备及存储介质,该方法在获取到神经网络的两个相邻训练版本时,可为这些版本所包含的各网络层生成专用的量化参数,并利用这些量化参数为对应的网络层进行浮点参数量化处理,得到训练版本对应的整数版本,再利用这些整数版本替代训练版本进行差量数据计算及差量压缩。换而言之,本发明为神经网络模型的每一网络层设置了生成的专用的量化参数,可采用不同力度对每一网络层进行针对性量化,相较于全局量化策略额外考虑了神经网络模型不同网络层之间的参数取值差异,能够有效避免将整个网络的浮点数参数看作一个集合来确定全局的量化参数所导致的量化误差增大及模型的精度下降问题。
-
-