一种基于模型的近端策略优化方法

    公开(公告)号:CN113947022A

    公开(公告)日:2022-01-18

    申请号:CN202111220714.X

    申请日:2021-10-20

    Abstract: 本发明公开了一种基于模型的近端策略优化方法,包括步骤:获取模拟环境,并确定所述模拟环境对应的环境模型和策略网络;基于所述策略网络与所述模拟环境,确定状态数据;其中,所述状态数据包括所述模拟环境的视频序列帧;基于所述模拟环境的视频序列帧训练所述环境模型,得到已训练的环境模型输出的预测图像;基于所述预测图像,更新所述状态数据,得到更新的状态数据;基于所述更新的状态数据,更新所述策略网络,得到更新的策略网络。融合基于模型的深度强化学习算法,提出了基于模型的近端策略优化框架,较好的解决了非完全信息博弈环境下采样利用率低的问题,在提高采样率的同时提升训练速度。

    黎曼几何不变性下基于曲线的三维人脸识别方法及系统

    公开(公告)号:CN112733758A

    公开(公告)日:2021-04-30

    申请号:CN202110054011.8

    申请日:2021-01-15

    Abstract: 本发明公开了一种黎曼几何不变性下基于曲线的三维人脸识别方法及系统,所述方法包括以下步骤:提取两张三维人脸的径向曲线和等测地轮廓线;将人脸分为刚性区域和非刚性区域,对经过人脸不同区域的径向曲线和等测地轮廓线设置不同的权值;采用曲线的形状分析方法,用SRVF描述符来表示径向曲线和等测地轮廓线,并进行配准与度量比较;计算两张三维人脸的对应测地线距离,并对所述两张三维人脸进行分类识别。相对于现有技术,本发明可以减少人脸数据的计算量,解决人脸表情变化时产生的形变对人脸识别产生的影响。

    非完备信息博弈中风险与收益均衡的最少遗憾的评估方法

    公开(公告)号:CN106296006A

    公开(公告)日:2017-01-04

    申请号:CN201610658485.2

    申请日:2016-08-10

    CPC classification number: G06Q10/0635 G06Q10/0637

    Abstract: 本发明提供了非完备信息博弈中风险与收益均衡的最少遗憾的评估方法,包括如下步骤:步骤1:针对每个信息集,初始化其策略、估值和每个动作的遗憾值;步骤2:使用当前的策略进行博弈,直至完成本次博弈;步骤3:在本次博弈所访问到的每个信息集上计算估值及每个动作的遗憾值;步骤4:根据遗憾匹配算法计算出新的策略;步骤5:计算新策略的风险值并综合考虑收益与风险的关系,挑选下一轮博弈中要使用的策略;步骤6:返回步骤2,直至博弈过程终止。本发明设计了一种利用经济学中风险的概念,并研究风险模型的原理,结合最少遗憾算法,应用在非完备信息机器博弈中。在利用最少遗憾算法收益占优策略的同时,兼顾策略的风险,达到更为合理的纳什均衡。

    一种基于分布式文件系统的移动云存储安全访问控制方法

    公开(公告)号:CN103209189A

    公开(公告)日:2013-07-17

    申请号:CN201310139638.9

    申请日:2013-04-22

    Abstract: 本发明提供了基于分布式文件系统的移动云存储安全访问控制方法,步骤1:用户向云存储平台发出云存储的文件访问请求;步骤2:中间服务器载入用户安全策略配置信息;步骤3:中间服务器根据配置信息关联用户访问请求,生成权限表达式;步骤4:中间服务器使用权限判定方法对权限表达式进行求解;步骤5:存储服务器根据表达式求解结果处理用户对文件的操作请求。本发明针对权限判定方法对权限校验机制进行优化,通过对权限表达式进行分析求值,避免了遍历和递归带来的损耗,大幅提高了系统性能,从而提高了安全访问控制技术的易用性和高效性。

    一种多序列标注问题的联合识别方法

    公开(公告)号:CN103020185A

    公开(公告)日:2013-04-03

    申请号:CN201210505053.X

    申请日:2012-11-30

    Abstract: 本发明提供了一种多序列标注问题的联合识别方法,包括以下步骤:步骤1:针对任务I,只采用基本特征生成分类器A,针对任务II,只采用基本特征生成分类器B;步骤2:针对任务I,采用任务I的基本特征和任务II的结果带来的特征生成分类器A2,针对任务II,采用任务II的基本特征和任务I的结果带来的特征生成分类器B2;步骤3:使用集成识别算法将分类器B和B2集成为CB,将分类器A和A2集成为CA;步骤4:重复步骤2和3,直到两个任务的准确率达到最大值。本发明弥补了序列标注任务单独识别时不能从其他任务得到有用信息的缺点,使得多个任务之间有效的交换信息,并通过分类器集成,提高整个任务的准确性。

    基于计算机视觉的手势输入法构建方法及系统

    公开(公告)号:CN102508547A

    公开(公告)日:2012-06-20

    申请号:CN201110345914.8

    申请日:2011-11-04

    Abstract: 本发明涉及一种基于计算机视觉的手势输入法的构建方法,步骤如下:采集手势、视频处理、手势分析、手势识别、构建手势输入法。利用异步缓冲模型对手势帧进行聚类,得到关键手势帧,只将关键手势帧进行后续的手势分析和手势识别,相对于以往的分析和识别每一帧手势的系统,有效提高了系统响应实时性。另外,本发明将手势识别与输入法的结合应用,是人机交互史上的创新。

    一种无人机群体联合侦查策略生成方法及终端

    公开(公告)号:CN116820121A

    公开(公告)日:2023-09-29

    申请号:CN202310544444.0

    申请日:2023-05-15

    Abstract: 本发明公开了一种无人机群体联合侦查策略生成方法及终端,方法包括:对待侦察区域的地图进行网格划分,并构建所有网格的概率信息集合;根据信息熵理论计算无人机群侦测形成的概率矩阵;根据历史启发算法计算区域地图网格的权重矩阵;根据概率矩阵对应的信息熵与权重矩阵中各权重的乘积计算得到对应的加权信息熵;选取加权信息熵满足预设条件的多个位置进行感知,通过调集可控数量的无人机,对带有侦查优先级的多个位置展开侦查;其中,多个位置的数量适配无人机群的当前规模。本发明可以做出满足全局最优的合理侦查决策,从而使无人机群体协同侦察更加具有自主性、灵活性、准确性、高效性,提高了多无人机协同执行任务的效率。

Patent Agency Ranking