-
公开(公告)号:CN117892625A
公开(公告)日:2024-04-16
申请号:CN202410066718.4
申请日:2024-01-17
Applicant: 上海交通大学
IPC: G06F30/27 , G06N5/01 , G06N7/01 , G06N3/092 , G06N3/084 , G06N3/0499 , G06N3/0464 , G06N3/045 , G06F111/08 , G06F111/04
Abstract: 本发明属于人工智能与决策搜索技术领域,本发明公开了一种冰壶击打自动化学习与决策搜索方法;包括以下步骤:S1、获取冰壶比赛初始状态;S2、使用表征网络将实际比赛状态映射为隐状态;S3、利用可微分仿真器计算逆向宏动作集合;S4、利用蒙特卡洛树搜索在隐空间中搜索策略;根据节点价值与访问次数计算出最优策略,本发明的表征网络的特征提取和嵌入层转换,将实际比赛状态映射为具有较低维度的隐状态表示,这样做可以减少冰壶比赛状态的维度,提取关键信息,并更好地表示状态之间的关联和重要性,可以提高冰壶自动化决策算法的效果,使其更准确、高效地进行决策,并更好地适应冰壶比赛的特点和要求。