-
公开(公告)号:CN117348387A
公开(公告)日:2024-01-05
申请号:CN202210745390.X
申请日:2022-06-27
Applicant: 北京三快在线科技有限公司 , 清华大学
IPC: G05B13/04
Abstract: 本申请公开了数据处理的方法、装置、设备及计算机可读存储介质,属于人工智能技术领域。其中,该方法包括:向初始超参数采样模型输入参考数值,得到初始超参数采样模型输出的参考向量,基于参考向量获取初始超参数;基于初始超参数确定目标数值,目标数值用于指示配置有初始超参数的控制系统的性能;基于目标数值更新初始超参数采样模型,得到目标超参数采样模型,目标超参数采样模型用于获取控制系统需要配置的目标超参数。本申请将目标数值作为初始超参数采样模型的更新依据,能够快速的训练得到目标超参数采样模型。因此,可基于该目标超参数采样模型智能的获取控制系统需要配置的目标超参数,获取效率较高,且目标超参数较为准确。
-
公开(公告)号:CN112084623B
公开(公告)日:2022-05-03
申请号:CN202010746731.6
申请日:2020-07-29
Applicant: 清华大学
IPC: G06F30/20 , G06Q10/06 , G06F111/04
Abstract: 本发明公开了一种基于随机采样的EBO事件选取方法及装置,其中,方法包括以下步骤:分析系统状态,生成所有可能的系统状态转移的集合构成事件空间;基于事件空间选取事件复杂度范围;依据事件复杂度范围在事件空间中进行随机采样,选取出性能最优的事件定义,并计算置信度。该方法不仅可以降低问题的求解复杂度,节约计算成本,而且还可以在给定计算量约束下得到令人满意的优化性能,并提供定量的性能保证。
-
公开(公告)号:CN112925331B
公开(公告)日:2021-09-24
申请号:CN202110502899.7
申请日:2021-05-10
Applicant: 北京三快在线科技有限公司 , 清华大学
Abstract: 本说明书公开了一种无人设备控制方法、装置、存储介质及电子设备,本说明书实施例先将无人设备的当前状态以及所述无人设备周围预设范围内各障碍物的当前状态输入决策模型,通过决策模型输出无人设备的初始控制策略。然后,将初始控制策略输入调整模型中,根据调整模型中的安全约束条件,对初始控制策略进行调整,得到最终控制策略。此方法中,将无人设备行驶的安全指标从现有技术中的强化学习模型中剥离出来,构成单独的安全约束条件。当无人设备处于复杂的场景时,可以根据该安全约束条件得到满足该安全约束条件的最终控制策略。这样,可以避免现有技术中的强化学习模型所存在的试错成本较高的问题。
-
公开(公告)号:CN113140261A
公开(公告)日:2021-07-20
申请号:CN202110448407.0
申请日:2021-04-25
Applicant: 清华大学
IPC: G16C20/10
Abstract: 本发明公开了一种化学分子合成仿真方法及装置,该方法包括:针对每一个输入组合中每一个初始形状,执行下述方法:通过遍历确定初始形状可拼接的引导分子,并进行拼接后得到第一合成形状;通过遍历确定第一合成形状上可拼接的基础分子,作为拼接分子;将其中一个拼接分子与第一合成形状拼接,得到第二合成形状,将第二合成形状作为新的初始形状,重新执行上述合成第二合成形状的方法,直至达到预设条件;选择另一个拼接分子,重复上述方法,得到初始形状可合成的所有合成形状,将所有合成形状划分为有限形状或无限形状;存储有限形状和无限形状的形状信息。本发明可以快速确定基础分子和引导分子能够合成的有限形状的数量和形状信息。
-
公开(公告)号:CN112987596A
公开(公告)日:2021-06-18
申请号:CN202110502942.X
申请日:2021-05-10
Applicant: 北京三快在线科技有限公司 , 清华大学
IPC: G05B17/02 , G05B23/02 , G01M17/007
Abstract: 本说明书公开了一种无人驾驶设备的测试方法及测试装置,并具体公开了,根据已知的各第一行驶参数配置所对应的测试评分,预估未执行过仿真测试的各第二行驶参数配置所对应的测试评分分布,而后,根据预估出的测试评分分布,从各第二行驶参数配置中选取出候选参数配置,并进行仿真测试得到对应的测试评分,随后,在确定候选参数配置不满足预设条件时,所有已经知道测试评分的行驶参数配置作为第一行驶参数配置,重新选取出候选参数配置,如此循环往复,直至选取出的候选参数配置满足预设条件为止,并确定出目标参数配置。这样,就不再需要针对每一组行驶参数配置进行仿真测试,因此,节约了计算资源,提高无人驾驶设备的测试效率。
-
公开(公告)号:CN112925331A
公开(公告)日:2021-06-08
申请号:CN202110502899.7
申请日:2021-05-10
Applicant: 北京三快在线科技有限公司 , 清华大学
Abstract: 本说明书公开了一种无人设备控制方法、装置、存储介质及电子设备,本说明书实施例先将无人设备的当前状态以及所述无人设备周围预设范围内各障碍物的当前状态输入决策模型,通过决策模型输出无人设备的初始控制策略。然后,将初始控制策略输入调整模型中,根据调整模型中的安全约束条件,对初始控制策略进行调整,得到最终控制策略。此方法中,将无人设备行驶的安全指标从现有技术中的强化学习模型中剥离出来,构成单独的安全约束条件。当无人设备处于复杂的场景时,可以根据该安全约束条件得到满足该安全约束条件的最终控制策略。这样,可以避免现有技术中的强化学习模型所存在的试错成本较高的问题。
-
公开(公告)号:CN112925210A
公开(公告)日:2021-06-08
申请号:CN202110508067.6
申请日:2021-05-11
Applicant: 北京三快在线科技有限公司 , 清华大学
Abstract: 本说明书公开了一种模型训练和控制无人设备的方法及装置,本说明书实施例在强化学习网络之外独立设置安全性验证的模块,当强化学习网络输出的控制策略不能通过安全性验证时,采用非强化学习算法模块出的控制策略作为待优化控制策略,并以待优化控制策略所能获得的奖励最大化为目标,对强化学习网络进行训练。这样,在对包含上述强化学习网络和非强化学习算法模块的强化学习模型在训练时,既不需要高精度的虚拟仿真系统,也极大的降低了实车试验的成本,训练后的强化学习模型也能适用于多种复杂场景。
-
公开(公告)号:CN111553041B
公开(公告)日:2021-02-26
申请号:CN202010326984.8
申请日:2020-04-23
Applicant: 清华大学 , 北京市燃气集团有限责任公司
Abstract: 本申请提供一种燃气管网参数校验方法、系统、终端及存储介质,所述方法包括:根据经验公式确定燃气管道摩擦阻力损失计算公式;确定燃气管道摩擦阻力损失计算公式的待校验参数及实测数据;根据管道设计图纸和经验设定待校验参数的初始值;获取与待校验参数数量相等的实测数据对;利用所述实测数据对组成的实测数据建立燃气管道摩擦阻力损失计算公式的非线性方程组,并采用牛顿‑拉夫逊法求解非线性方程组得到多组参数校验值;获取多组参数校验值并计算参数校验值的均值,得到最终的参数的估计值;本申请基于燃气网管SCADA采集数据系统和燃气管道实际参数相结合对比校验的方法,并通过牛顿‑拉夫逊方法进行求解分析,实现真实工况参数实时模拟测量。
-
公开(公告)号:CN112306059A
公开(公告)日:2021-02-02
申请号:CN202011104599.5
申请日:2020-10-15
Applicant: 北京三快在线科技有限公司 , 清华大学
IPC: G05D1/02
Abstract: 本说明书公开了一种控制模型的训练方法、控制方法以及装置,获取第一采集设备和第一采集设备周围的第一障碍物在设定历史时刻时的状态数据,作为第一状态数据。将第一状态数据输入到控制模型中,确定出第一采集设备在设定历史时刻之后的规划轨迹。根据规划轨迹,确定控制模型对应的奖励函数的奖励值,并根据奖励值,对控制模型进行训练。本方法通过第一采集设备和第一采集设备周围的障碍物在设定历史时刻时的状态数据,进行控制模型的训练,通过训练完成的控制模型规划轨迹,根据规划轨迹对无人驾驶设备进行控制,从而降低了无人驾驶设备与周围障碍物发生碰撞的概率。
-
公开(公告)号:CN112084623A
公开(公告)日:2020-12-15
申请号:CN202010746731.6
申请日:2020-07-29
Applicant: 清华大学
IPC: G06F30/20 , G06Q10/06 , G06F111/04
Abstract: 本发明公开了一种基于随机采样的EBO事件选取方法及装置,其中,方法包括以下步骤:分析系统状态,生成所有可能的系统状态转移的集合构成事件空间;基于事件空间选取事件复杂度范围;依据事件复杂度范围在事件空间中进行随机采样,选取出性能最优的事件定义,并计算置信度。该方法不仅可以降低问题的求解复杂度,节约计算成本,而且还可以在给定计算量约束下得到令人满意的优化性能,并提供定量的性能保证。
-
-
-
-
-
-
-
-
-