-
公开(公告)号:CN116383504A
公开(公告)日:2023-07-04
申请号:CN202310368921.2
申请日:2023-04-03
Applicant: 哈尔滨工业大学(深圳)
IPC: G06F16/9535 , G06F21/62 , G06F18/241 , G06F18/214 , G06N3/042
Abstract: 本发明公开了一种基于梯度混洗的信息推荐方法及相关设备,所述方法包括:获取目标对象的历史评分项目的参数;获取多个待推荐项目,根据所述历史评分项目的参数、多个所述待推荐项目和已训练的信息推荐模型获取各所述待推荐项目对应的推荐分数,其中,所述已训练的信息推荐模型在训练过程中各个训练客户端基于预设的梯度混洗方式对训练梯度参数进行梯度混洗,并上传至中心服务器进行训练;根据各所述待推荐项目对应的推荐分数从多个所述待推荐项目中选择获取目标推荐项目,并向所述目标对象推送所述目标推荐项目。本发明有利于在推荐数据的过程中提高用户数据的安全性,从而保护用户信息数据的隐私。
-
公开(公告)号:CN116383488A
公开(公告)日:2023-07-04
申请号:CN202310260656.6
申请日:2023-03-10
Applicant: 哈尔滨工业大学(深圳)
IPC: G06F16/9535 , G06F17/16 , G06N20/20 , G06F21/62
Abstract: 本发明公开了一种基于本地差分隐私的以用户为中心的推荐方法及系统,所述方法包括:云服务器生成项目矩阵,并将所述项目矩阵发送给客户端;所述客户端根据本地评分数据集生成用户矩阵和用户平均评级向量,然后获取第一梯度、第二梯度和第三梯度并对所述第二梯度进行差分隐私处理,得到目标梯度;所述云服务器根据所述目标梯度更新所述项目矩阵;所述客户端获取更新后的所述项目矩阵并重新执行获取第一梯度、第二梯度和第三梯度的步骤,直至满足目标收敛条件。本发明提出的基于本地差分隐私的以用户为中心的推荐方法,通过将用户平均评分数据引入矩阵分解模型中,使得评分预测更加准确,实现了以用户为中心的推荐方法。
-
公开(公告)号:CN113486665B
公开(公告)日:2023-06-20
申请号:CN202110757350.2
申请日:2021-07-05
Applicant: 哈尔滨工业大学(深圳)
IPC: G06F40/295 , G06F21/62 , G06N3/042 , G06N3/047 , G06N3/084 , G06F18/214 , G06F18/2415
Abstract: 本发明公开了一种隐私保护文本命名实体识别方法、装置、计算机设备及存储介质,方法包括:接收多个数据持有方发送的多个训练好的教师模型,所述教师模型通过使用源数据进行训练,包括第一预训练网络和第一序列标注层,所述源数据为标注文本数据;根据多个训练好的教师模型,利用无标签的迁移集合进行多教师知识蒸馏从而训练学生模型,所述学生模型包括第二预训练网络和第二序列标注层;利用训练好的学生模型对无标签文本数据的命名实体进行预测。本发明将知识蒸馏应用于数据分散的真实场景,在数据可用不可见的前提下,通过无标签的迁移集合,训练出强大的学生模型,从而在隐私保护的前提下,保证学生模型在命名实体识别任务上的泛化性和准确性。
-
公开(公告)号:CN113148940B
公开(公告)日:2023-06-16
申请号:CN202110055749.6
申请日:2021-01-15
Applicant: 哈尔滨工业大学(深圳)
Abstract: 本发明提供了具有梳齿状折流凸起结构的微通道散热器,包括微通道基体,所述微通道基体包括若干平行间隔阵列排布的微槽道,所述微槽道沿着高度方向的横截面为倒梯形,并且所述微槽道的两侧壁面周期性交错排布若干梳齿状折流凸起结构,可显著增大换热面积、破坏流体正常流动、增强扰流,实现强化换热。制备时,先加工出具有反向类梳状结构的压印模芯;将模芯与基板对准、定位,通过热压印得到具有类梳状折流凸起结构的微通道基体;最后将其进行密封封装得到上述微通道散热器。本发明解决了阵列大面积异形微通道一次加工成形的难题,具有过程简单,成本低、效率高的优点。
-
公开(公告)号:CN116212356A
公开(公告)日:2023-06-06
申请号:CN202310072057.1
申请日:2023-01-12
Applicant: 哈尔滨工业大学(深圳)
IPC: A63F1/00 , G06F18/214 , G06N3/04 , G06N3/08
Abstract: 本发明公开了一种基于深度回归抽象技术的虚拟遗憾策略求解方法及设备,所述方法包括:构建回归器网络,将回归器网络进行初始化并遍历博弈树收集历史数据;根据蓄水池采样方法对历史数据进行采样得到训练集,并基于训练集的数据对回归器网络进行训练;当回归器网络的训练次数达到最大训练轮次时停止训练,得到目标回归器网络,并获取深度回归虚拟遗憾最小化算法的到达概率,目标回归器网络根据到达概率计算得到平均策略。本发明使用神经网络作为回归器生成虚拟遗憾最小化算法迭代所需的遗憾值,减少信息抽象的影响,并使得算法无需存储大型表格,减少了算法的存储资源开销,同时利用神经网络的拟合能力也提升了算法的通用性与泛化性。
-
公开(公告)号:CN115767108A
公开(公告)日:2023-03-07
申请号:CN202211285499.6
申请日:2022-10-20
Applicant: 哈尔滨工业大学(深圳)
IPC: H04N19/91 , H04N19/147 , H04N19/124
Abstract: 本发明公开了一种基于特征域匹配的分布式图像压缩方法、系统,所述方法包括:获取主图像量化采样信号,并将所述主图像量化采样信号通过单一深度解码器处理获得初步重构图像和解码主信息特征;再使用单一深度图像压缩模型获得边信息图像的无损边信息特征和解码边信息特征;接着对解码主信息特征和解码边信息特征进行相关性匹配,并选取无损边信息特征进行特征域相关块对齐操作获得匹配特征;最后使用特征融合网络对初步重构图像和匹配特征进行迭代融合获得最终重构图像。本实施例通过基于特征域多尺度块匹配方法取得更好的率失真表现。
-
公开(公告)号:CN115761178A
公开(公告)日:2023-03-07
申请号:CN202211232601.6
申请日:2022-10-10
Applicant: 哈尔滨工业大学(深圳)
IPC: G06T17/20 , G06T15/20 , G06T15/50 , G06T7/64 , G06V10/42 , G06V10/44 , G06V10/80 , G06N3/0464 , G06N3/082
Abstract: 本发明涉及立体视图三维重建技术领域,具体涉及一种基于隐式神经表示的多视图三维重建方法,在隐式神经表示和体渲染技术的基础上提出一种基于像素特征融合的多视图三维重建算法,考虑了不同视角下入射光对重建几何形状的影响,而且通过设计像素特征图编码器提取多视角图像的像素特征,以融入到表面点的全局几何特征中,改进整个重建模型的体渲染过程,进而提高物体表面精细程度,重建出高分辨率的精细网格表示的三维物体模型。
-
公开(公告)号:CN114048834B
公开(公告)日:2023-01-17
申请号:CN202111303694.2
申请日:2021-11-05
Applicant: 哈尔滨工业大学(深圳)
Abstract: 本发明公开了一种基于事后回顾和渐进式扩展的持续强化学习非完全信息博弈方法及装置,包括下述步骤:获取非完全博弈环境,确定任务目标;构建第一神经网络和基于未来值预测的强化学习方法;构建事后经验回顾池;对第一神经网络进行训练,直至第一神经网络收敛;构建渐进式神经网络,实现网络模型的渐进式扩展;选择下一个任务作为任务目标,利用基于未来值预测的强化学习方法持续训练,直至所有的任务都训练完成。本发明通过使用非完全信息博弈场景中丰富的智能体状态变化作为监督信号,解决该环境下的奖励稀疏问题,同时引入持续学习框架渐进式神经网络对未来值预测网络结构进行动态扩展,解决了在该环境下的多任务场景中的灾难性遗忘的问题。
-
公开(公告)号:CN114139637B
公开(公告)日:2022-11-04
申请号:CN202111470623.1
申请日:2021-12-03
Applicant: 哈尔滨工业大学(深圳)
Abstract: 本申请公开了一种多智能体信息融合方法、装置、电子设备及可读存储介质。其中,方法包括构建操作预测网络模型和门控注意力机制模型,门控注意力机制模型根据不同来源信息以交互过程中学习的比例进行融合,且各智能体基于自身数据和通信信息融合结果共同确定是否接收通信信息融合结果。将多智能体应用模拟环境的状态信息输入至操作预测网络模型,得到各智能体的预测动作;根据多智能体应用模拟环境基于各智能体的预测动作信息输出的各预测动作得分和下一时刻的状态信息、每个智能体的价值评估信息,基于门控注意力机制模型的强化学习算法更新操作预测网络模型,循环训练操作预测网络模型直至收敛。本申请提升了多智能体信息融合效果。
-
公开(公告)号:CN110404264B
公开(公告)日:2022-11-01
申请号:CN201910676407.9
申请日:2019-07-25
Applicant: 哈尔滨工业大学(深圳)
Abstract: 本发明提供了一种基于虚拟自我对局的多人非完备信息博弈策略求解方法、装置、系统及存储介质,该方法包括:针对二人博弈情况,使用多类别逻辑回归和蓄水池抽样实现了平均策略的生成,使用DQN和环形缓冲记忆实现了最优反应策略的生成;针对多人博弈情况,使用多智能体近端策略优化算法MAPPO实现最优反应策略,同时使用多智能体NFSP调节智能体的训练。本发明的有益效果是:本发明引入了虚拟自我对局的算法框架,将德州扑克策略优化过程分为最优反应策略学习和平均策略学习两个部分,并分别用模仿学习和深度强化学习来实现,设计出了更为通用的多智能体最优策略学习方法。
-
-
-
-
-
-
-
-
-