-
公开(公告)号:CN114706513A
公开(公告)日:2022-07-05
申请号:CN202210413350.5
申请日:2022-04-20
Applicant: 哈尔滨工业大学(深圳)(哈尔滨工业大学深圳科技创新研究院)
Abstract: 本发明公开了一种基于unity3D和手部运动捕捉的VR化学实验室实施方法与系统,方法包括:通过建模软件构建VR实验场景中的模组和化学实验室模型;通过unity3D引擎构建所述VR实验场景中实验所需的虚拟环境;识别用户的手部初始位置,输入用户手部的初始位置坐标与VR实验场景中的手部模型匹配,将手部动作实时映射到所述VR实验场景中的手部模型;根据用户的操作弹出相应的文字和语音提示,指导实验者操作。本发明通过使用VR设备、unity3D引擎构建了虚拟化学实验室,将学生置入原有课堂无法实现的场景中,促进学生对知识的深入理解,操作者可以在虚拟化学实验室里通过硬件交互的手段来对实验器材进行操作,提高训练效果,加深对实验的理解,同时减少成本,提高安全性。
-
公开(公告)号:CN111291890B
公开(公告)日:2021-01-01
申请号:CN202010399728.1
申请日:2020-05-13
Applicant: 哈尔滨工业大学(深圳)(哈尔滨工业大学深圳科技创新研究院)
Abstract: 本发明提供了一种博弈策略优化方法、系统及存储介质,该博弈策略优化方法包括建立基于最大熵的策略递度算法步骤和多智能体最优反应策略求解步骤。本发明的有益效果是:本发明采用中心化训练和分散式执行的方式,提高动作估值网络的准确性,同时引入了全局基线奖励来更准确地衡量智能体的动作收益,以此来解决人博弈中的信用分配问题。同时引入了最大熵方法来进行策略评估,平衡了策略优化过程中的探索与利用。
-
公开(公告)号:CN111260040A
公开(公告)日:2020-06-09
申请号:CN202010370070.1
申请日:2020-05-06
Applicant: 哈尔滨工业大学(深圳)(哈尔滨工业大学深圳科技创新研究院)
Abstract: 本发明提供了一种基于内在奖励的视频游戏决策方法,包括以下步骤:S1、获取视频游戏模拟环境;S2、构建神经网络模型;S3、设计内在奖励模型;S4、将内在奖励模型与构建的神经网络模型结构结合;S5、通过模拟环境获取游戏的记录;S6、通过获取的游戏记录,更新神经网络模型;S7、循环训练神经网络模型直至收敛。本发明的有益效果是:较好的解决了三维场景中较为常见的缺乏环境反馈奖励值的问题。
-
公开(公告)号:CN118982064B
公开(公告)日:2025-03-11
申请号:CN202411473105.9
申请日:2024-10-22
Applicant: 哈尔滨工业大学(深圳)(哈尔滨工业大学深圳科技创新研究院)
IPC: G06N3/098 , G06N3/0464
Abstract: 本申请公开了去中心化的联邦学习方法、系统及相关设备,涉及计算机技术领域,包括:联邦学习的组织者和参与者加入区块链;组织者将参与者划分为普通节点和委员会节点;各节点基于区块链获取联邦学习任务配置信息和待训练的全局模型并进行本地模型更新获得前一轮次训练完成后的本地模型;普通节点对前一轮次训练完成后的本地模型进行训练获得当前轮次的本地训练模型并上传至区块链;委员会节点通过区块链获取本地训练模型以确定普通节点的贡献度评分及当前轮次训练完成后的全局模型,并确定委员会节点对应的贡献度评分;响应于触发委员会节点更新事件,组织者重新进行节点身份划分。如此,有利于提高联邦学习过程中模型训练的准确性。
-
公开(公告)号:CN118246556A
公开(公告)日:2024-06-25
申请号:CN202410668413.0
申请日:2024-05-28
Applicant: 哈尔滨工业大学(深圳)(哈尔滨工业大学深圳科技创新研究院)
IPC: G06N5/04 , G06N3/0455 , G06N3/0499 , G06N3/092 , G06F16/35 , G06F8/41
Abstract: 本发明公开了一种基于强化学习的类型推断方法及装置,包括:获取运行环境数据和代码数据,并对所述运行环境数据和所述代码数据进行预处理,得到合法类型序列及类型流序列;根据所述合法类型序列及所述类型流序列,进行带类型标注的代码生成任务的监督训练;根据生成的带类型标注的目标代码,进行静态反馈的强化学习训练,得到强化后的代码生成模型。本发明提出了使用基于生成的方法来预测类型,并通过强化学习来增强生成模型的类型预测的准确性,解决了现有的类型推断模型的预测结果与实际应用偏差较大的问题。
-
公开(公告)号:CN117035074B
公开(公告)日:2024-02-13
申请号:CN202311286288.9
申请日:2023-10-08
Applicant: 哈尔滨工业大学(深圳)(哈尔滨工业大学深圳科技创新研究院)
Abstract: 本发明公开了一种基于反馈强化的多模态知识生成方法及装置,包括:构建多模态模型,在多模态知识生成任务中将人类反馈引入所述多模态模型,形成的监督数据用于训练预先设立的奖励回报模型;将所述监督数据输入奖励回报模型进行训练,使得奖励回报模型从所述监督数据中学习到人类的理解;利用内外探索相结合的强化学习方法微调所述多模态模型,使得多模态模型能够学习到人类偏好,生成更自然的知识;本发明具有人类反馈知识的强化学习方法应用于多模态知识生成任务中,解决了多模态知识生成任务缺乏人类反馈监督的不足,并引入基于内外探索相结合的强化学习微调技术,有效缓解多奖励稀疏问题。
-
公开(公告)号:CN115200603A
公开(公告)日:2022-10-18
申请号:CN202211106644.X
申请日:2022-09-13
Applicant: 哈尔滨工业大学(深圳)(哈尔滨工业大学深圳科技创新研究院)
Abstract: 本发明公开了一种基于同态加密和匿名伪装的导航服务隐私保护方法及装置,方法包括:LBS服务商进行同态加密方案的初始化;用户利用匿名伪装算法分别生成出匿名伪装区域;用户根据匿名伪装区域的路网信息,随机选取出发点附近满足伪装距离L的出发地伪装点和目的地伪装点,同步规划出真实出发地到伪装出发地的路线;云服务商规划出一组候选路线,同时向LBS服务商请求实时路况信息;云服务商对候选路线组的开销进行进一步计算,利用全同态加密的比较运算,将密文比较结果传输给LBS服务商;从候选路线组中选取最佳路线并在本地将和伪装区域内的路线连接,生成最终的出行路线。本发明采用全同态加密和匿名伪装技术实现高质量的导航服务隐私保护。
-
公开(公告)号:CN114422606B
公开(公告)日:2022-06-28
申请号:CN202210249791.6
申请日:2022-03-15
Applicant: 哈尔滨工业大学(深圳)(哈尔滨工业大学深圳科技创新研究院)
Abstract: 本申请公开了一种联邦学习的通信开销压缩方法、装置、设备及介质,包括:根据联邦学习中的模型参数在训练前后的变化幅度确定基本参数,并将基本参数所在的卷积核中的所有模型参数确定为待传输参数;基于卷积核的目标特征将卷积核中的待传输参数封装至不同数据包中;对不同数据包中的待传输参数进行二值量化,并对待传输参数对应的索引进行位置编码,如此一来,由于一个卷积核内所有待传输参数的位置信息都是固定的,因此一个索引可以反应整个卷积核中所有待传输参数的位置信息,一定程度上降低了索引的通信开销,同时,本申请通过对待传输参数进行量化,对待传输参数对应的索引进行位置编码,进一步减少了通信开销。
-
公开(公告)号:CN112819052B
公开(公告)日:2021-12-24
申请号:CN202110094267.1
申请日:2021-01-25
Applicant: 哈尔滨工业大学(深圳)(哈尔滨工业大学深圳科技创新研究院)
Abstract: 本发明涉及机器视觉技术领域,公开了一种多模态细粒度混合方法、系统、设备和存储介质,所述多模态细粒度混合方法包括:从多模态图文数据中提取数据特征,并获取数据特征的各个组成成分;数据特征包括视觉区域特征和文本单词特征;对数据特征的各个组成成分的模态信息进行细粒度分类,得到分类结果;根据分类结果,对各个组成成分进行来自模态内和模态间的信息融合,得到融合特征。本发明实施例提供的多模态细粒度混合方法在多模态细粒度混合时不以模态为单位进行,考虑到了各模态中不同组成成分的特点,所处上下文环境的差异,选择对应的合适的交互方式,可以使得多模态模型在利用多模态数据互补的特点的同时,避免不相关信息的影响。
-
公开(公告)号:CN112183108B
公开(公告)日:2021-06-22
申请号:CN202010927402.1
申请日:2020-09-07
Applicant: 哈尔滨工业大学(深圳)(哈尔滨工业大学深圳科技创新研究院)
IPC: G06F40/30 , G06F16/36 , G06F16/383
Abstract: 本申请涉及一种短文本主题分布的推理方法、系统、计算机设备和存储介质。该方法包括:抽取单位时间内短文本中出现的共现词对,整合共现词对获取词组集合;根据语义相似度和历史共现度对所述词组集合进行关联,获取词组集合的动态关联度,并以词组矩阵形式存储所述动态关联度;从词组集合中进行主题名称的抽取,并根据所述动态关联度修正所述主题名称;统计修正后的所述短文本中主题名称,获取所述短文本的主题分布。通过设计的动态关联度这一指标,赋予了各个共现词对不同的重要性。此外,该方法中主题名称的提取具有偏向性的主题模型,从而能够抽取出更加连续紧凑的各种主题名称,更加准确的推理出各个短文本的主题分布。
-
-
-
-
-
-
-
-
-