-
公开(公告)号:CN114139637A
公开(公告)日:2022-03-04
申请号:CN202111470623.1
申请日:2021-12-03
Applicant: 哈尔滨工业大学(深圳)
Abstract: 本申请公开了一种多智能体信息融合方法、装置、电子设备及可读存储介质。其中,方法包括构建操作预测网络模型和门控注意力机制模型,门控注意力机制模型根据不同来源信息以交互过程中学习的比例进行融合,且各智能体基于自身数据和通信信息融合结果共同确定是否接收通信信息融合结果。将多智能体应用模拟环境的状态信息输入至操作预测网络模型,得到各智能体的预测动作;根据多智能体应用模拟环境基于各智能体的预测动作信息输出的各预测动作得分和下一时刻的状态信息、每个智能体的价值评估信息,基于门控注意力机制模型的强化学习算法更新操作预测网络模型,循环训练操作预测网络模型直至收敛。本申请提升了多智能体信息融合效果。
-
公开(公告)号:CN114048834A
公开(公告)日:2022-02-15
申请号:CN202111303694.2
申请日:2021-11-05
Applicant: 哈尔滨工业大学(深圳)
Abstract: 本发明公开了一种基于事后回顾和渐进式扩展的持续强化学习非完全信息博弈方法及装置,包括下述步骤:获取非完全博弈环境,确定任务目标;构建第一神经网络和基于未来值预测的强化学习方法;构建事后经验回顾池;对第一神经网络进行训练,直至第一神经网络收敛;构建渐进式神经网络,实现网络模型的渐进式扩展;选择下一个任务作为任务目标,利用基于未来值预测的强化学习方法持续训练,直至所有的任务都训练完成。本发明通过使用非完全信息博弈场景中丰富的智能体状态变化作为监督信号,解决该环境下的奖励稀疏问题,同时引入持续学习框架渐进式神经网络对未来值预测网络结构进行动态扩展,解决了在该环境下的多任务场景中的灾难性遗忘的问题。
-
公开(公告)号:CN113961667A
公开(公告)日:2022-01-21
申请号:CN202111112028.0
申请日:2021-09-23
Applicant: 哈尔滨工业大学(深圳)
IPC: G06F16/33 , G06F16/332 , G06F16/35
Abstract: 本发明公开了一种基于Bert的动态阈值调整的智能问答系统,其特征在于方法步骤如下:S101:获取用户问题q;S102:将用户问题q通过基于关键字向量化的问句匹配方法,得到Kw个相似的标准问题;S103:将用户问题q通过BERT预训练模型,得到Kr个相似的标准问题;S104:按照一定的规则挑选出两个方法得到的标准问题作为匹配的标准问题集;S105:将标准问题集通过动态阈值调整模块得到最终的结果;本发明结合标准问答对知识库的管理,提出了一个动态阈值调整的问题匹配方法,可以匹配识别未训练的标准问题,进一步提高问题回答的准确率。
-
公开(公告)号:CN110399920B
公开(公告)日:2021-07-27
申请号:CN201910676439.9
申请日:2019-07-25
Applicant: 哈尔滨工业大学(深圳)
Abstract: 本发明提供了一种基于深度强化学习的非完备信息博弈方法、装置、系统及存储介质,该方法包括:探索利用机制改进策略梯度算法的步骤、深度强化学习网络中加入记忆单元的步骤、自我驱动机制对奖励值进行优化的步骤。本发明的有益效果是:本发明通过基线函数解决策略梯度算法经常出现的高方差问题,对于强化学习采样和优化过程时间复杂度高的问题,采取并行机制提高模型求解效率,通过自驱动机制,在弥补环境奖励值稀疏的同时,帮助智能体更有效地对环境进行探索。
-
公开(公告)号:CN103761519B
公开(公告)日:2017-05-17
申请号:CN201310719654.5
申请日:2013-12-20
Applicant: 哈尔滨工业大学深圳研究生院
Abstract: 本发明提供了一种基于自适应校准的非接触式视线追踪方法,结合BFS算法、图像几何特征和灰度特征的光斑特征提取方法,将光斑与对应的光源进行精确匹配;利用一维边缘检测算子和最小二乘椭圆拟合进行循环拟合,去除噪点,直到椭圆中心固定的拟合方法,最终得到精确的瞳孔中心;并提出一种动态自适应的校准方法,有效提高了现有的空间映射模型精度。
-
公开(公告)号:CN103679731A
公开(公告)日:2014-03-26
申请号:CN201310700137.3
申请日:2013-12-18
Applicant: 哈尔滨工业大学深圳研究生院
IPC: G06T7/00
Abstract: 本发明提供了一种基于文档图像的圆弧分割方法,包括如下步骤:步骤1)确定圆弧的参数;步骤2)利用对称轴校正步骤1)中的参数;步骤3)判断是完整圆还是部分圆。该方法能提高文档图像的矢量化效率。为纸质文档的数字化,电子文档的管理,以及根据二维图纸构建三维模型提供强有力的支持。
-
-
-
-
-