-
公开(公告)号:CN119672499A
公开(公告)日:2025-03-21
申请号:CN202510180760.3
申请日:2025-02-19
Applicant: 鹏城实验室
IPC: G06V10/82 , G06V10/80 , G06V10/764 , G06V10/96 , G06N3/0455 , G06N3/084
Abstract: 本申请实施例公开了一种视觉决策模型训练方法及相关方法、装置、设备及介质。视觉决策模型包括编码子模型和决策子模型,通过获取图像数据和视觉事件数据,将图像数据和视觉事件数据输入到编码子模型中,输出融合特征;将融合特征输入到决策子模型中,输出目标动作和目标动作对应的评价值;根据图像数据、视觉事件数据和融合特征确定出编码子模型对应的第一损失;根据目标动作和评价值确定出决策子模型对应的第二损失;根据第一损失对编码子模型进行迭代训练,得到训练后的编码子模型;根据第二损失对决策子模型进行迭代训练,得到训练后的决策子模型;训练后的视觉决策模型包括训练后的编码子模型和训练后的决策子模型。
-
公开(公告)号:CN119659657A
公开(公告)日:2025-03-21
申请号:CN202510199602.2
申请日:2025-02-24
Applicant: 鹏城实验室
Abstract: 本申请实施例提出的车辆驾驶控制方法、装置、电子设备及存储介质,方法包括:首先,获取车辆在行驶过程中当前时刻的图像信息和导航信息;其次,基于图像信息进行轨迹预测处理得到预测轨迹,并基于预测轨迹得到第一控制决策;然后,基于导航信息和预测轨迹进行多步控制处理,得到第二控制决策,并基于第一控制决策和第二控制决策组合得到初步控制决策;接下来,将图像信息输入碰撞修正模型进行数据处理,得到安全控制决策,并基于安全控制决策和初步控制决策进行整合处理,得到目标控制决策;最后,基于目标控制决策对车辆进行驾驶控制,可以提高预定路线的控制可靠性以及运行控制安全性。
-
公开(公告)号:CN119204152A
公开(公告)日:2024-12-27
申请号:CN202411147180.6
申请日:2024-08-20
Applicant: 鹏城实验室
IPC: G06N3/092 , G06N3/0895
Abstract: 本申请实施例公开一种策略探索模型训练方法、装置、计算机设备及存储介质。其中,根据标注数据集确定出人类偏好奖励和人类非偏好奖励,根据人类偏好奖励和人类非偏好奖励构建奖励模型;在非标注数据集中确定出目标非标注数据的预设状态及其对应的第一探索策略;获取智能体根据第一探索策略以及预设状态与环境交互输出动作状态数据集和执行结果,将执行结果输入到奖励模型中输出奖励值,将奖励值设置在动作状态数据集中;确定动作状态数据集中每个动作状态组对应的动作价值和标签值;根据动作价值和标签值确定出每个动作状态组对应的评价值,根据预设探索策略和评价值对第一探索策略更新,实现策略探索模型迭代训练,直至训练完成。
-
公开(公告)号:CN119201217A
公开(公告)日:2024-12-27
申请号:CN202411142946.1
申请日:2024-08-19
Applicant: 鹏城实验室
IPC: G06F8/75
Abstract: 本申请实施例提供智能博弈引擎配置文件解析方法、装置、设备和存储介质,涉及人工智能技术领域。该方法获取智能博弈引擎的至少一个初始配置YAML文件,从初始配置YAML文件中提取配置项和配置参数,根据业务逻辑和配置类型生成至少一个目标配置类,根据配置项生成目标配置类的字段名称和字段类型,根据配置参数生成字段名称对应的属性值,基于属性规则对配置参数进行参数校验,当属性值都校验通过后,对目标配置类进行实例化,得到配置文件解析结果。不同于相关技术中解析过程较为复杂且计算量大。本实施例中直接将初始配置YAML文件中的数据映射到类对象的属性上,从而避免对每个层级进行逐个解析,提高配置相关数据的处理速度和效率。
-
公开(公告)号:CN119113513A
公开(公告)日:2024-12-13
申请号:CN202411104222.8
申请日:2024-08-12
Applicant: 鹏城实验室
Abstract: 本申请公开了博弈对局的显示方法、装置、系统、电子设备及存储介质,方法包括:响应于目标对象在前端页面上触发的博弈连接操作,生成博弈连接请求;通过连接接口将博弈连接请求发送至后端,并获取后端返回的博弈对局关联信息;根据博弈对局关联信息在前端页面上渲染显示第一博弈对局画面;响应于目标对象触发的博弈操作,通过动作接口向后端发送博弈操作指令,以按照机器博弈指令在博弈对局中执行与其他目标博弈智能体之间的博弈对抗;通过前端与后端之间的状态接口获取后端在博弈对局中执行博弈对抗之后返回的博弈对局数据,并在前端页面上对博弈对局数据进行画面渲染显示。本发明实施例能够实现对博弈过程的实时展示,便于用户理解博弈过程。
-
公开(公告)号:CN118537507A
公开(公告)日:2024-08-23
申请号:CN202410606649.1
申请日:2024-05-15
Applicant: 鹏城实验室
Abstract: 本申请公开一种图像渲染方法与相关方法、装置、设备及存储介质。方法包括:获取目标空间中的目标位置;在目标空间对应的空间坐标系下确定目标位置对应的空间位置坐标;基于目标空间对应的坐标映射关系对空间位置坐标进行坐标系转换,得到目标位置在目标空间对应的感知坐标系下的目标旋转矩阵和目标转移矩阵;通过目标渲染模型根据目标旋转矩阵和目标转移矩阵进行图像渲染,得到目标位置对应的目标渲染图像。该方法在获取目标位置对应的空间位置坐标时,可以基于坐标映射关系实现坐标系的转换,使得目标渲染模型能够根据空间位置坐标在感知坐标系下的目标旋转矩阵和目标转移矩阵准确地进行图像渲染,提高场景感知的准确性。
-
公开(公告)号:CN117861230A
公开(公告)日:2024-04-12
申请号:CN202410038263.5
申请日:2024-01-10
Applicant: 鹏城实验室
IPC: A63F13/822 , A63F13/55 , G06N3/092
Abstract: 本实施例提出一种兵棋推演的策略生成方法、电子设备和存储介质。通过基于每个智能体的状态空间和动作空间构建多智能体的联合状态空间、联合动作空间、联合奖励函数和状态转移函数,使多智能体可以在团队层面进行学习和决策,将多智能体决策问题转化为生成动作序列的策略生成问题,大幅降低了多智能体决策的复杂度,同时,控制每个智能体在决策时除了基于智能体的观测信息外还需考虑其它智能体的动作序列,避免由于多智能体之间的策略不可传递导致每个智能体在决策时陷入局部最优,使得多智能体可以输出全局最优解,同时避免多智能体协作过程中的不平稳问题,有效提高了兵棋推演场景下多智能体决策的平稳性。
-
-
-
-
-
-