Patent search ap:("哈尔滨工业大学(深圳)(哈尔滨工业大学深圳科技创新研究院)") AND inv:"何志坤" Page 1

1.

发明公开
基于内在奖励的视频游戏决策方法有权

公开(公告)号：CN111260040A

公开(公告)日：2020-06-09

申请号：CN202010370070.1

申请日：2020-05-06

Applicant: 哈尔滨工业大学(深圳)(哈尔滨工业大学深圳科技创新研究院)

Inventor： 王轩 , 漆舒汉 , 张加佳 , 曹睿 , 何志坤 , 刘洋 , 蒋琳 , 廖清 , 夏文 , 李化乐

IPC: G06N3/04 , G06N3/08 , A63F13/45 , A63F13/46

Abstract: 本发明提供了一种基于内在奖励的视频游戏决策方法，包括以下步骤：S1、获取视频游戏模拟环境；S2、构建神经网络模型；S3、设计内在奖励模型；S4、将内在奖励模型与构建的神经网络模型结构结合；S5、通过模拟环境获取游戏的记录；S6、通过获取的游戏记录，更新神经网络模型；S7、循环训练神经网络模型直至收敛。本发明的有益效果是：较好的解决了三维场景中较为常见的缺乏环境反馈奖励值的问题。

2.

发明授权
基于内在奖励的视频游戏决策方法有权

公开(公告)号：CN111260040B

公开(公告)日：2020-11-06

申请号：CN202010370070.1

申请日：2020-05-06

Applicant: 哈尔滨工业大学(深圳)(哈尔滨工业大学深圳科技创新研究院)

Inventor： 王轩 , 漆舒汉 , 张加佳 , 曹睿 , 何志坤 , 刘洋 , 蒋琳 , 廖清 , 夏文 , 李化乐

IPC: G06N3/04 , G06N3/08 , A63F13/45 , A63F13/46

Abstract: 本发明提供了一种基于内在奖励的视频游戏决策方法，包括以下步骤：S1、获取视频游戏模拟环境；S2、构建神经网络模型；S3、设计内在奖励模型；S4、将内在奖励模型与构建的神经网络模型结构结合；S5、通过模拟环境获取游戏的记录；S6、通过获取的游戏记录，更新神经网络模型；S7、循环训练神经网络模型直至收敛。本发明的有益效果是：较好的解决了三维场景中较为常见的缺乏环境反馈奖励值的问题。

Patent Agency Ranking