-
公开(公告)号:CN114139637B
公开(公告)日:2022-11-04
申请号:CN202111470623.1
申请日:2021-12-03
Applicant: 哈尔滨工业大学(深圳)
Abstract: 本申请公开了一种多智能体信息融合方法、装置、电子设备及可读存储介质。其中,方法包括构建操作预测网络模型和门控注意力机制模型,门控注意力机制模型根据不同来源信息以交互过程中学习的比例进行融合,且各智能体基于自身数据和通信信息融合结果共同确定是否接收通信信息融合结果。将多智能体应用模拟环境的状态信息输入至操作预测网络模型,得到各智能体的预测动作;根据多智能体应用模拟环境基于各智能体的预测动作信息输出的各预测动作得分和下一时刻的状态信息、每个智能体的价值评估信息,基于门控注意力机制模型的强化学习算法更新操作预测网络模型,循环训练操作预测网络模型直至收敛。本申请提升了多智能体信息融合效果。
-
公开(公告)号:CN110404264B
公开(公告)日:2022-11-01
申请号:CN201910676407.9
申请日:2019-07-25
Applicant: 哈尔滨工业大学(深圳)
Abstract: 本发明提供了一种基于虚拟自我对局的多人非完备信息博弈策略求解方法、装置、系统及存储介质,该方法包括:针对二人博弈情况,使用多类别逻辑回归和蓄水池抽样实现了平均策略的生成,使用DQN和环形缓冲记忆实现了最优反应策略的生成;针对多人博弈情况,使用多智能体近端策略优化算法MAPPO实现最优反应策略,同时使用多智能体NFSP调节智能体的训练。本发明的有益效果是:本发明引入了虚拟自我对局的算法框架,将德州扑克策略优化过程分为最优反应策略学习和平均策略学习两个部分,并分别用模仿学习和深度强化学习来实现,设计出了更为通用的多智能体最优策略学习方法。
-
公开(公告)号:CN114844621A
公开(公告)日:2022-08-02
申请号:CN202210365746.7
申请日:2022-04-08
Applicant: 哈尔滨工业大学(深圳) , 暨南大学
Abstract: 本发明公开了一种基于多密钥全同态加密的多用户隐私保护机器学习方法及装置,方法包括:由公共字符串CRS进行多密钥全同态加密算法的初始化、生成安全参数λ及生成公共参数集mkparams;服务器S整合各个数据提供方上传的单密钥密文数据Encski(di)得到多密钥密文数据集Encsk(D);服务器S在多密钥密文数据集Encsk(D)的基础上将普通机器学习算法中的线性运算替换为全同态加法和全同态乘法,对多密钥密文数据集Encsk(D)进行机器学习建模训练;服务器S将多密钥加密的模型密文Encsk(model)下发给各个数据提供方DPi和解密方DE;解密多密钥模型密文Encsk(model),从而得到由各个数据提供方DPi的数据D训练得到的模型model=Decsk(Encsk(model))。本发明在保证较高安全性的同时,以较低通信代价和较少交互次数完成隐私计算任务。
-
公开(公告)号:CN113763539A
公开(公告)日:2021-12-07
申请号:CN202111054666.1
申请日:2021-09-09
Applicant: 哈尔滨工业大学(深圳)
Abstract: 本发明公开了一种基于图像和三维输入的隐式函数三维重建方法,其包括:通过三维输入预测网络处理三维输入以生成三维点的第一空间占用概率;通过图像预测网络处理输入图像以生成三维点的第二空间占用概率;所述的第一空间占用概率和第二空间占用概率被用来生成三维重建模型作为输出。本发明具有能准确提取二维图像包含的细节信息又能表达三维输入表示的结构形状信息而重建高准确度的三维模型的优点。
-
公开(公告)号:CN113554545A
公开(公告)日:2021-10-26
申请号:CN202110858190.0
申请日:2021-07-28
Applicant: 哈尔滨工业大学(深圳)
Abstract: 本发明涉及一种用于图像处理模型版权保护的模型水印方法,包括:获取一个训练完成的图像处理模型M(θ;·);在原始训练数据(X,Y)的GT图像集Y中嵌入一个不可见的水印w得到嵌入水印后的GT图像集Yw;然后在嵌入水印后的训练数据(X,Yw)上训练该模型来改变模型的参数为其嵌入水印,得到嵌入水印后的模型M(θw;·);方法还包括所有权验证,通过验证从触发图像中水印提取的成功率即可实现对经修改的模型或可疑模型SM的版权验证。能够实现对图像处理模型的版权保护,模型的保真性、唯一性和鲁棒性优异,具有很强的通用性,可用于任何输出是图像的模型的版权保护。
-
公开(公告)号:CN112183580A
公开(公告)日:2021-01-05
申请号:CN202010927478.4
申请日:2020-09-07
Applicant: 哈尔滨工业大学(深圳)
Abstract: 一种基于动态知识路径学习的小样本分类方法,包括如下步骤:基于知识图的知识挑选阶段,通过将辅助集组成知识图,用以小样本实例在知识图中寻找适合自己的学习路径;基于类别约束的动态路径生成阶段,小样本实例选择知识图中最相关的知识点组成路径,引入路径在类别级的约束,获得类别共性,通过计算路径损失来约束路径的好坏;基于路径的知识学习与分类阶段,顺序地将最相关的知识点所携带的信息提取出来增强目标实例的特征表达,查询集实例与支撑集中每一个小样本实例的特征表达进行相似度计算,使得目标实例分到相似度最高的类别上,然后使用交叉熵损失来衡量分类损失,通过分类损失和路径损失的加权求和建立小样本分类模型。
-
公开(公告)号:CN112183108A
公开(公告)日:2021-01-05
申请号:CN202010927402.1
申请日:2020-09-07
Applicant: 哈尔滨工业大学(深圳)
IPC: G06F40/30 , G06F16/36 , G06F16/383
Abstract: 本申请涉及一种短文本主题分布的推理方法、系统、计算机设备和存储介质。该方法包括:抽取单位时间内短文本中出现的共现词对,整合共现词对获取词组集合;根据语义相似度和历史共现度对所述词组集合进行关联,获取词组集合的动态关联度,并以词组矩阵形式存储所述动态关联度;从词组集合中进行主题名称的抽取,并根据所述动态关联度修正所述主题名称;统计修正后的所述短文本中主题名称,获取所述短文本的主题分布。通过设计的动态关联度这一指标,赋予了各个共现词对不同的重要性。此外,该方法中主题名称的提取具有偏向性的主题模型,从而能够抽取出更加连续紧凑的各种主题名称,更加准确的推理出各个短文本的主题分布。
-
公开(公告)号:CN111931233A
公开(公告)日:2020-11-13
申请号:CN202010806166.8
申请日:2020-08-12
Applicant: 哈尔滨工业大学(深圳)
IPC: G06F21/62 , G06F16/2458 , G06F16/27
Abstract: 本申请实施例公开了一种基于区块链和本地化差分隐私保护的信息推荐方法及系统,用于在进行信息推荐的同时保证用户数据的安全性和确保用户隐私信息不被泄露。本申请实施例方法包括:对区块链用户的用户数据进行聚类分析,以及对该区块链用户的预处理数据进行本地化差分隐私处理而得到模糊化数据,并由星际文件系统对该模糊化数据进行哈希计算而得到哈希值,在得到区块链用户的桶号以及哈希值之后,可以基于该桶号及哈希值,根据推荐算法向目标区块链用户进行信息推荐。本申请实施例中,免除了中心服务器的参与,避免中心服务器被攻击而导致用户信息泄露,同时本地化差分隐私处理也保证了用户数据的隐秘性,增强了数据的安全性,降低隐私泄露的风险。
-
公开(公告)号:CN110404264A
公开(公告)日:2019-11-05
申请号:CN201910676407.9
申请日:2019-07-25
Applicant: 哈尔滨工业大学(深圳)
Abstract: 本发明提供了一种基于虚拟自我对局的多人非完备信息博弈策略求解方法、装置、系统及存储介质,该方法包括:针对二人博弈情况,使用多类别逻辑回归和蓄水池抽样实现了平均策略的生成,使用DQN和环形缓冲记忆实现了最优反应策略的生成;针对多人博弈情况,使用多智能体近端策略优化算法MAPPO实现最优反应策略,同时使用多智能体NFSP调节智能体的训练。本发明的有益效果是:本发明引入了虚拟自我对局的算法框架,将德州扑克策略优化过程分为最优反应策略学习和平均策略学习两个部分,并分别用模仿学习和深度强化学习来实现,设计出了更为通用的多智能体最优策略学习方法。
-
公开(公告)号:CN114897267B
公开(公告)日:2024-02-27
申请号:CN202210665590.4
申请日:2022-06-14
Applicant: 哈尔滨工业大学(深圳) , 中国电子科技集团公司第五十四研究所
IPC: G06Q10/0631
Abstract: 本发明公开了面向多对多智能体协同作战场景的火力分配方法及系统,所述方法包括:确定红蓝对抗问题想定,所述红蓝对抗问题想定包括红蓝对抗单元的种类、数量、射击间隔及对抗问题、红蓝双方的目标任务和胜负判断准则;基于语义的想定建模,将所述红蓝对抗问题想定进行结构化抽象,并将博弈对抗问题的图像信息转化为语义信息;基于语义态势认知模块计算火力分配方案,并将所有我方单位指定打击对象;构建语义体系,基于向量化火力打击结果生成火力打击对象决策语义,并执行当前决策指令。本发明尽可能地将火力均匀分配到各个敌方上,使得每一个火力都最大化地得到利用。
-
-
-
-
-
-
-
-
-