非完备信息博弈中风险与收益均衡的最少遗憾的评估方法

    公开(公告)号:CN106296006A

    公开(公告)日:2017-01-04

    申请号:CN201610658485.2

    申请日:2016-08-10

    CPC classification number: G06Q10/0635 G06Q10/0637

    Abstract: 本发明提供了非完备信息博弈中风险与收益均衡的最少遗憾的评估方法,包括如下步骤:步骤1:针对每个信息集,初始化其策略、估值和每个动作的遗憾值;步骤2:使用当前的策略进行博弈,直至完成本次博弈;步骤3:在本次博弈所访问到的每个信息集上计算估值及每个动作的遗憾值;步骤4:根据遗憾匹配算法计算出新的策略;步骤5:计算新策略的风险值并综合考虑收益与风险的关系,挑选下一轮博弈中要使用的策略;步骤6:返回步骤2,直至博弈过程终止。本发明设计了一种利用经济学中风险的概念,并研究风险模型的原理,结合最少遗憾算法,应用在非完备信息机器博弈中。在利用最少遗憾算法收益占优策略的同时,兼顾策略的风险,达到更为合理的纳什均衡。

Patent Agency Ranking