-
公开(公告)号:CN111260040A
公开(公告)日:2020-06-09
申请号:CN202010370070.1
申请日:2020-05-06
Applicant: 哈尔滨工业大学(深圳)(哈尔滨工业大学深圳科技创新研究院)
Abstract: 本发明提供了一种基于内在奖励的视频游戏决策方法,包括以下步骤:S1、获取视频游戏模拟环境;S2、构建神经网络模型;S3、设计内在奖励模型;S4、将内在奖励模型与构建的神经网络模型结构结合;S5、通过模拟环境获取游戏的记录;S6、通过获取的游戏记录,更新神经网络模型;S7、循环训练神经网络模型直至收敛。本发明的有益效果是:较好的解决了三维场景中较为常见的缺乏环境反馈奖励值的问题。
-
公开(公告)号:CN116503642A
公开(公告)日:2023-07-28
申请号:CN202310269638.4
申请日:2023-03-15
Applicant: 哈尔滨工业大学(深圳)
IPC: G06V10/764 , G06V10/42 , G06V10/82 , G06N3/098 , G06N20/20
Abstract: 本发明公开了一种基于改进联邦学习的数据分类方法、系统及相关设备,方法包括:目标客户端根据预设的改进联邦学习算法对其对应的待训练的数据分类模型进行模型迭代训练,获得对应的已训练的数据分类模型,目标客户端根据预设的改进联邦学习算法进行一轮迭代时,基于全局特征提取器模型参数、全局分类器模型参数和本地分类器模型参数对待训练的数据分类模型的模型参数进行调整,全局特征提取器模型参数和全局分类器模型参数由目标客户端从服务器获取,本地分类器模型参数由目标客户端从本地存储的数据获取;目标客户端获取待分类数据,通过对应的已训练的数据分类模型进行分类获取待分类数据对应的目标类别。本发明有利于提高数据分类的准确性。
-
公开(公告)号:CN108447080B
公开(公告)日:2023-05-23
申请号:CN201810175534.6
申请日:2018-03-02
Applicant: 哈尔滨工业大学深圳研究生院
IPC: G06T7/277 , G06N3/0464
Abstract: 本发明公开了一种基于分层数据关联和卷积神经网络的目标跟踪方法、系统和存储介质,其方法包括:获取跟踪目标的当前视频帧的检测响应以及当前视频帧之前的所有视频帧的跟踪片段;为每一条跟踪片段计算其置信度,其中,跟踪片段置信度是指当前已经完成部分连接的跟踪片段的可信赖程度;根据置信度的大小,将所有的跟踪片段分为高可靠度跟踪片段和低可靠度跟踪片段两部分,并以当前视频帧的检测响应为关联对象,为高可靠度跟踪片段进行局部数据关联处理,为低可靠度跟踪片段进行全局数据关联处理。本发明可以有效降低关联算法的时间复杂度,能够有效缓解在跟踪的过程中出现的局部遮挡问题,同时可以实现算法的鲁棒性和实时性的均衡。
-
公开(公告)号:CN114897267A
公开(公告)日:2022-08-12
申请号:CN202210665590.4
申请日:2022-06-14
Applicant: 哈尔滨工业大学(深圳) , 中国电子科技集团公司第五十四研究所
Abstract: 本发明公开了面向多对多智能体协同作战场景的火力分配方法及系统,所述方法包括:确定红蓝对抗问题想定,所述红蓝对抗问题想定包括红蓝对抗单元的种类、数量、射击间隔及对抗问题、红蓝双方的目标任务和胜负判断准则;基于语义的想定建模,将所述红蓝对抗问题想定进行结构化抽象,并将博弈对抗问题的图像信息转化为语义信息;基于语义态势认知模块计算火力分配方案,并将所有我方单位指定打击对象;构建语义体系,基于向量化火力打击结果生成火力打击对象决策语义,并执行当前决策指令。本发明尽可能地将火力均匀分配到各个敌方上,使得每一个火力都最大化地得到利用。
-
公开(公告)号:CN108510559B
公开(公告)日:2022-03-08
申请号:CN201810288688.6
申请日:2018-03-30
Applicant: 哈尔滨工业大学深圳研究生院
IPC: G06T9/00
Abstract: 本发明涉及一种基于有监督多视角离散化的多媒体二值编码方法。该方法包括:S1.假设一个由n幅图像组成训练集,通过学习得到包含一系列子函数的哈希函数,将样本的两种不同模态的特征映射到经过优化的特征空间中,得到的一系列与哈希子函数对应的哈希值,然后通过二值量化将哈希值转化为二值化哈希码:S2.基于有监督训练的哈希函数:定义一个线性多分类模型并对模型函数进行优化,采用最小平方损失作为目标函数;S3.基于最小量化损失的哈希函数:假设一种模态的特征,通过哈希函数优化至量化损失最小;S4.基于多视角锚图的哈希函数:构造锚图,并采用锚图正则化哈希函数;S5.优化算法。本发明既可以保持数据在原始空间相似性,又能提高检索的准确率。
-
公开(公告)号:CN113947022A
公开(公告)日:2022-01-18
申请号:CN202111220714.X
申请日:2021-10-20
Applicant: 哈尔滨工业大学(深圳)
IPC: G06F30/27 , G06V20/40 , G06K9/62 , G06V10/774 , G06V10/764 , G06N20/00
Abstract: 本发明公开了一种基于模型的近端策略优化方法,包括步骤:获取模拟环境,并确定所述模拟环境对应的环境模型和策略网络;基于所述策略网络与所述模拟环境,确定状态数据;其中,所述状态数据包括所述模拟环境的视频序列帧;基于所述模拟环境的视频序列帧训练所述环境模型,得到已训练的环境模型输出的预测图像;基于所述预测图像,更新所述状态数据,得到更新的状态数据;基于所述更新的状态数据,更新所述策略网络,得到更新的策略网络。融合基于模型的深度强化学习算法,提出了基于模型的近端策略优化框架,较好的解决了非完全信息博弈环境下采样利用率低的问题,在提高采样率的同时提升训练速度。
-
公开(公告)号:CN110309331B
公开(公告)日:2021-07-27
申请号:CN201910599265.0
申请日:2019-07-04
Applicant: 哈尔滨工业大学(深圳)
IPC: G06F16/51 , G06F16/583 , G06F16/31 , G06F16/33 , G06K9/62
Abstract: 本发明专利涉及一种基于自监督的跨模态联合哈希检索方法,该方法包括以下步骤:步骤1:针对图像模态数据进行处理:采用深度卷积神经网络对图像模态的数据进行特征提取,对图片数据进行哈希学习,将深度卷积神经网络的最后一层全连接层的节点个数设置为哈希码的长度;步骤2:针对文本模态数据进行处理:使用词袋模型对文本数据进行建模,建立一个两层的全连接神经网络对文本模态的数据进行特征提取,神经网络的输入是使用词袋模型表示的词向量,第一个全连接层节点的数据与第二个全连接层节点的数据与哈希码的长度相同;步骤3:针对类别标签处理的神经网络:采用自监督的训练方式从标签数据中提取语义特征;步骤4:最小化图像与文本网络所提取的特征与标签网络的语义特征间的距离,使得图像与文本网络的哈希模型能够更充分学习不同模态间的语义特征。
-
公开(公告)号:CN111816331A
公开(公告)日:2020-10-23
申请号:CN202010550894.7
申请日:2020-06-16
Applicant: 哈尔滨工业大学
Abstract: 一种支撑力可控冷冻靶表征支撑机构,属于惯性约束聚变技术领域。本发明解决了现有的在冷冻靶实验设备中,如果不为冷冻靶长悬臂增加支撑,则工作时易出现靶点振动量增加,而导致无法实现精确表征,而如果为冷冻靶长悬臂增加固定的支撑杆,则会导致工作时防碍悬臂运动的问题。它包括动力组件、伸缩组件及支撑组件,所述伸缩组件固定安装在真空腔体的外部且其伸缩端穿装在真空腔体内,所述伸缩组件通过动力组件提供伸缩动力,所述支撑组件包括顶块,所述顶块固定连接在伸缩组件的伸缩端。通过动力组件控制伸缩组件的伸缩,进而控制顶块顶紧与远离冷冻靶长悬臂,实现对长悬臂稳定支撑,同时不影响冷冻靶长悬臂运动。
-
公开(公告)号:CN107784663B
公开(公告)日:2020-10-20
申请号:CN201711124878.6
申请日:2017-11-14
Applicant: 哈尔滨工业大学深圳研究生院
Abstract: 本发明公开了一种基于深度信息的相关滤波跟踪方法及装置,其方法包括:基于深度图的图像分割技术,自适应性量化深度信息,得到深度图像分割结果;利用深度图像分割结果,根据不同场景构建相应的三维空间模型的分层结构;利用分层结构,并结合核相关滤波跟踪算法处理目标尺度变化及检测遮挡。本发明一方面过滤前景和背景信息减少跟踪的干扰因素,结合成熟的图像特征提取技术;另一方面这样的分层结构简化了深度信息的使用方法,使得处理目标尺度变化以及检测遮挡更为容易。结合核相关滤波跟踪算法实现了使用二维表观模型在空间结构下的跟踪方法,能够有效应对遮挡和处理目标尺度变化,提高视觉跟踪效果。
-
公开(公告)号:CN110874488A
公开(公告)日:2020-03-10
申请号:CN201911121760.7
申请日:2019-11-15
Applicant: 哈尔滨工业大学(深圳)
IPC: G06F21/62
Abstract: 本发明提供了一种基于混合差分隐私的流数据频数统计方法、装置、系统及存储介质,该流数据频数统计方法包括:创建候选列表步骤:针对用户集合S,在保证差分隐私的前提下,近似地获得出现频数最多的记录;收集数据步骤:用户在本地实现差分隐私算法,将隐私化数据传送到服务器端;隐私预算分配步骤:将连续序列分为个时间戳,在其分配隐私预算,根据时间,分配的隐私预算递减。本发明的有益效果是:本发明采用差分隐私和本地差分隐私结合的方式,能够从数据收集和数据分析层面实现对数据的高效保护,且能提高流数据实时发布速率。
-
-
-
-
-
-
-
-
-