-
公开(公告)号:CN114048834A
公开(公告)日:2022-02-15
申请号:CN202111303694.2
申请日:2021-11-05
Applicant: 哈尔滨工业大学(深圳)
Abstract: 本发明公开了一种基于事后回顾和渐进式扩展的持续强化学习非完全信息博弈方法及装置,包括下述步骤:获取非完全博弈环境,确定任务目标;构建第一神经网络和基于未来值预测的强化学习方法;构建事后经验回顾池;对第一神经网络进行训练,直至第一神经网络收敛;构建渐进式神经网络,实现网络模型的渐进式扩展;选择下一个任务作为任务目标,利用基于未来值预测的强化学习方法持续训练,直至所有的任务都训练完成。本发明通过使用非完全信息博弈场景中丰富的智能体状态变化作为监督信号,解决该环境下的奖励稀疏问题,同时引入持续学习框架渐进式神经网络对未来值预测网络结构进行动态扩展,解决了在该环境下的多任务场景中的灾难性遗忘的问题。
-
公开(公告)号:CN113961667A
公开(公告)日:2022-01-21
申请号:CN202111112028.0
申请日:2021-09-23
Applicant: 哈尔滨工业大学(深圳)
IPC: G06F16/33 , G06F16/332 , G06F16/35
Abstract: 本发明公开了一种基于Bert的动态阈值调整的智能问答系统,其特征在于方法步骤如下:S101:获取用户问题q;S102:将用户问题q通过基于关键字向量化的问句匹配方法,得到Kw个相似的标准问题;S103:将用户问题q通过BERT预训练模型,得到Kr个相似的标准问题;S104:按照一定的规则挑选出两个方法得到的标准问题作为匹配的标准问题集;S105:将标准问题集通过动态阈值调整模块得到最终的结果;本发明结合标准问答对知识库的管理,提出了一个动态阈值调整的问题匹配方法,可以匹配识别未训练的标准问题,进一步提高问题回答的准确率。
-
公开(公告)号:CN110399920B
公开(公告)日:2021-07-27
申请号:CN201910676439.9
申请日:2019-07-25
Applicant: 哈尔滨工业大学(深圳)
Abstract: 本发明提供了一种基于深度强化学习的非完备信息博弈方法、装置、系统及存储介质,该方法包括:探索利用机制改进策略梯度算法的步骤、深度强化学习网络中加入记忆单元的步骤、自我驱动机制对奖励值进行优化的步骤。本发明的有益效果是:本发明通过基线函数解决策略梯度算法经常出现的高方差问题,对于强化学习采样和优化过程时间复杂度高的问题,采取并行机制提高模型求解效率,通过自驱动机制,在弥补环境奖励值稀疏的同时,帮助智能体更有效地对环境进行探索。
-
公开(公告)号:CN110321479B
公开(公告)日:2021-07-20
申请号:CN201910447142.5
申请日:2019-05-27
Applicant: 哈尔滨工业大学(深圳)
IPC: G06F16/9535 , G06F21/62
Abstract: 一种隐私保护移动服务推荐方法及客户端、推荐系统,其中隐私保护移动服务推荐方法包括以下步骤:获取用户的样本数据,样本数据为用户的个人信息的省却信息、虚假信息、粗粒度信息或细粒度信息;根据样本数据从一网络服务提供商接收第一服务推荐列表;根据用户的细粒度信息从第一服务推荐列表中筛选且生成第二服务推荐列表;将第二服务推荐列表展示给用户。由于将第一服务推荐列表下载到本地客户端来辅助生成符合用户需求的第二服务推荐列表,使得在保证用户个人信息不受网络服务提供商侵犯的前提下,实现了为用户提供准确推荐服务的功能,能够维持移动服务推荐精度与保护用户隐私之间的平衡,利于用户更好地管理好个人信息。
-
公开(公告)号:CN110188194B
公开(公告)日:2020-12-01
申请号:CN201910354263.5
申请日:2019-04-26
Applicant: 哈尔滨工业大学(深圳)
Abstract: 本发明公开了一种基于多任务学习模型的假新闻检测方法及系统。在一个实施例中:采用多任务学习模型,对待检测新闻的真实性检测和主题分类这两个任务进行联合训练,并同时返回所述待检测新闻的真实性以及所述待检测新闻的所属主题。本发明实施例的教导,能够同时检测出新闻的真实性以及新闻的所属主题,且提高了假新闻检测和主题分类的准确性。
-
公开(公告)号:CN107145791B
公开(公告)日:2020-07-10
申请号:CN201710224275.7
申请日:2017-04-07
Applicant: 哈尔滨工业大学深圳研究生院
Abstract: 本发明提供一种具有隐私保护的K‑means聚类方法及系统,属于数据挖掘技术领域。本发明包括如下步骤:数据拥有者A和B加密各自的数据和随机选择的质心点,上传至服务器;服务器通过安全乘法协议和安全距离计算协议在密文数据中计算数据点到质心点的欧氏距离,并将数据点归类;服务器、数据拥有者A和B通过安全电路协议共同在密文数据中重新计算新的质心点;数据拥有者A或B通过安全比较协议判断新的质心点与原质心点的距离,如果小于阈值,结束分类,数据拥有者A和B请求服务器将分类好的数据分别发送给数据拥有者A和B,否则,重新上传新的质心点,进行下一轮迭代。本发明在保证数据隐私安全的同时保证了数据挖掘结果的正确性;支持数据存储外包和数据计算外包,在保证正确性的同时,执行效率也大幅度提升;支持三个参与方中最多一方为恶意方的安全计算。
-
公开(公告)号:CN110795982A
公开(公告)日:2020-02-14
申请号:CN201910599803.6
申请日:2019-07-04
Applicant: 哈尔滨工业大学(深圳)
Abstract: 本发明专利涉及一种结合人体姿态信息估计视线方法,设计了一个包含显著目标检测分支、头部姿态估计分支和人体姿态估计分支的深度卷积神经网络估计视线方向。三个分支的特征图最后通过点乘给出注视点位置的预测,注视点位置与头部中心位置的连线作为视线方向。通过该结合人体姿态的视线估算方法能够提高视线估计算法的准确度和鲁棒性。
-
公开(公告)号:CN108694414A
公开(公告)日:2018-10-23
申请号:CN201810455121.3
申请日:2018-05-11
Applicant: 哈尔滨工业大学深圳研究生院
CPC classification number: G06K9/6268 , G06N3/0454
Abstract: 本发明提供了一种基于数字图像转化和深度学习的数字取证文件碎片分类方法,先将文件碎片转换为灰度图像,然后利用深度学习提取图像的更多隐藏特征,以提高文件碎片分类的性能;其中,所述更多隐藏特征包括:不同的纹理特征,随机特征和用于分类的可压缩性;所述深度学习采用修改和优化的CNN模型,所述模型的第一层卷积层使用1x1比例的卷积核,它使用许多管道使网络结构复杂化;由于每个层中都有不同数量和尺度的滤波核,通过梯度下降和逆向训练来训练最佳匹配本分类模型特征图。本发明通过利用CNN的局部连接和权重共享的优点,提取文件碎片的高维特征,该方案对于以前方案中不易分类的文件,如复合文件和压缩文件,也能实现高精度的碎片分类。
-
公开(公告)号:CN103761519B
公开(公告)日:2017-05-17
申请号:CN201310719654.5
申请日:2013-12-20
Applicant: 哈尔滨工业大学深圳研究生院
Abstract: 本发明提供了一种基于自适应校准的非接触式视线追踪方法,结合BFS算法、图像几何特征和灰度特征的光斑特征提取方法,将光斑与对应的光源进行精确匹配;利用一维边缘检测算子和最小二乘椭圆拟合进行循环拟合,去除噪点,直到椭圆中心固定的拟合方法,最终得到精确的瞳孔中心;并提出一种动态自适应的校准方法,有效提高了现有的空间映射模型精度。
-
公开(公告)号:CN103679731A
公开(公告)日:2014-03-26
申请号:CN201310700137.3
申请日:2013-12-18
Applicant: 哈尔滨工业大学深圳研究生院
IPC: G06T7/00
Abstract: 本发明提供了一种基于文档图像的圆弧分割方法,包括如下步骤:步骤1)确定圆弧的参数;步骤2)利用对称轴校正步骤1)中的参数;步骤3)判断是完整圆还是部分圆。该方法能提高文档图像的矢量化效率。为纸质文档的数字化,电子文档的管理,以及根据二维图纸构建三维模型提供强有力的支持。
-
-
-
-
-
-
-
-
-