用于增强学习的策略生成网络的训练方法、装置和电子设备

    公开(公告)号:CN112016678B

    公开(公告)日:2024-08-09

    申请号:CN202010867107.1

    申请日:2020-08-26

    发明人: 赵瑞 徐伟

    摘要: 公开了一种用于增强学习的策略生成网络的训练方法,训练装置和电子设备。该用于增强学习的策略生成网络的训练方法包括:获取执行任务的对象的连续对象状态信息和所述对象所作用的环境的连续环境状态信息;确定所述连续对象状态信息和所述连续环境状态信息的联合概率分布,以及所述连续对象状态信息和所述连续环境状态信息各自的第一边缘分布和第二边缘分布;确定所述联合概率分布与所述第一边缘分布和所述第二边缘分布之积的KL散度值;以及,以所述KL散度值作为奖励函数而通过预定策略更新所述策略生成网络的参数。这样,提高了策略生成网络生成策略的性能。

    音频数据的处理方法、装置、介质和设备

    公开(公告)号:CN116994598A

    公开(公告)日:2023-11-03

    申请号:CN202310954455.6

    申请日:2023-07-31

    发明人: 程光伟

    摘要: 公开了一种音频数据的处理方法、装置、存储介质和电子设备,其中,方法包括:获取在目标场景中的多个音频采集设备采集的音频数据;基于第一预设算法,对音频数据进行声源分离,得到至少一路第一音频信号,并确定各第一音频信号与多个音区之间的信号音区对应关系;基于第二预设算法,对音频数据进行声源分离,得到至少一路第二音频信号;确定各第一音频信号与各第二音频信号之间的信号对应关系;基于信号对应关系,分别对存在对应关系的第一音频信号与第二音频信号进行混合处理,得到各第一音频信号分别对应的目标音频信号;基于信号音区对应关系,分别确定各目标音频信号对应的目标音区。本公开实现了场景中分布式音频采集设备的精准拾音。

    盲信号分离方法、装置和电子设备

    公开(公告)号:CN110890098B

    公开(公告)日:2022-05-10

    申请号:CN201811045478.0

    申请日:2018-09-07

    发明人: 胡玉祥 朱长宝

    IPC分类号: G10L21/0208 G10L21/0272

    摘要: 公开了一种盲信号分离方法、装置和电子设备。该方法包括:使用复数高斯分布对声源进行建模,以确定声源的概率密度分布;基于所述概率密度分布来更新盲信号分离模型;以及,使用更新后的盲信号分离模型对音频信号进行分离,以获得多个分离的输出信号。这样,可以通过基于复数高斯分布获得的声源的概率密度分布更新盲信号分离模型,从而有效地提升盲信号分离算法在特定场景下的分离性能。

    用于数据统计的电路单元、电路模块和装置

    公开(公告)号:CN108052483B

    公开(公告)日:2021-10-22

    申请号:CN201711474618.1

    申请日:2017-12-29

    发明人: 谭洪贺 孟南

    IPC分类号: G06F15/82 G06T1/20

    摘要: 公开了一种用于数据统计的电路单元、电路模块和装置。该电路单元包括第一寄存器和第二寄存器,并且在第一控制端接收到有效的控制信号的情况下在第一寄存器中存储经由第一输入端接收到的数据,在第二控制端接收到有效的控制信号的情况下在第二寄存器中存储经由第二输入端接收到的数据,并且在第三控制端接收到有效的控制信号的情况下将存储在第二寄存器中的数据的值增加1。该电路模块包括一个或多个这样的电路单元,并且该装置包括一个或多个这样的电路模块。这样的电路模块或装置能够使用较少的资源和功耗来完成数据统计。

    运动状态预测方法、装置、电子设备及车辆

    公开(公告)号:CN110706374B

    公开(公告)日:2021-06-29

    申请号:CN201910959816.X

    申请日:2019-10-10

    发明人: 刘景初

    IPC分类号: G07C5/08 G06K9/00 G06N3/04

    摘要: 本申请公开了一种运动状态预测方法、装置、计算机可读存储介质、电子设备和车辆,涉及辅助驾驶领域。该方法包括:获取目标物的第一运动状态数据;确定所述第一运动状态数据对应的数值序列,基于所述第一运动状态数据与所述数值序列确定第二运动状态数据,其中,各第一运动状态数据所对应的数值序列不相同,各第一运动状态数据与其所对应的数值序列的维度相同;根据所述第二运动状态数据确定第一特征图;将所述第一特征图输入至目标预测模型,确定包括所述第一运动状态数据的预测值的第二特征图;根据所述数值序列及所述第二特征图,确定所述第一运动状态数据的预测值。本方案提高了获取运动状态数据的灵活性、效率和准确度。

    对封闭空间中的设备进行控制的方法和装置、介质、设备

    公开(公告)号:CN113014815A

    公开(公告)日:2021-06-22

    申请号:CN202110233609.3

    申请日:2021-03-03

    发明人: 林锦彬

    IPC分类号: H04N5/232 G07C9/00

    摘要: 本公开实施例公开了一种对封闭空间中的设备进行控制的方法和装置、介质、设备,其中,方法包括:接收当前用户在当前时间发出的进入预设封闭空间的请求;根据所述预设封闭空间在当前时间的状态,为所述当前用户开启所述预设封闭空间的门禁;在以所述当前时间点为起点的设定时间段内检测处于所述预设封闭空间内的人员的肢体动作;基于所述肢体动作的检测结果,控制所述预设封闭空间中的至少一个设备的工作状态。本公开实施例可以通过状态和用户识别,有效解决了预设封闭空间使用时间冲突的问题,提高了预设封闭空间的安全性和使用效率;通过肢体动作检测实现了动作控制预设封闭空间内的设备,简化了设备操作,提高了用户体验。

    关键点识别模型的生成方法和关键点识别方法

    公开(公告)号:CN111985556A

    公开(公告)日:2020-11-24

    申请号:CN202010836005.3

    申请日:2020-08-19

    发明人: 窦宇豪 苏治中

    IPC分类号: G06K9/62 G06N3/04 G06N3/08

    摘要: 本公开实施例公开了一种关键点识别模型的生成方法和装置、关键点识别方法和装置、计算机可读存储介质及电子设备,其中,关键点识别模型的生成方法包括:基于初始模型包括的热力图生成模块,生成样本图像对应的热力图集合;基于初始模型包括的预测矢量转换模块,将热力图集合中的热力图转换为预测矢量;基于关键点集合中的关键点的位置信息,确定关键点集合中的关键点对应的监督矢量;基于预测矢量和监督矢量,对初始模型进行训练,得到关键点识别模型。本公开实施例可以提高模型训练的收敛速度,以及提高训练后的模型的识别准确性和效率。

    一种摄像头的外参数调整方法及装置

    公开(公告)号:CN111627066A

    公开(公告)日:2020-09-04

    申请号:CN201910145211.7

    申请日:2019-02-27

    发明人: 敖焕轩 潘铭星

    IPC分类号: G06T7/80

    摘要: 本申请公开了一种摄像头的外参数调整方法,包括:在当前帧图像中确定至少两条车道线之间的相交点的像面坐标;基于所述相交点的像面坐标确定所述摄像头的目标外参数;获取所述摄像头的当前外参数;基于所述当前外参数和所述目标外参数,调整摄像头外参数。本申请在车辆行驶状态下根据实际道路状况对摄像头外参数进行动态标定,使得摄像头外参数长期保持较高的精度。

    对混合信号进行降噪的方法和装置

    公开(公告)号:CN108766455B

    公开(公告)日:2020-04-03

    申请号:CN201810466106.9

    申请日:2018-05-16

    发明人: 朱长宝

    摘要: 公开了一种对混合信号进行降噪的方法和装置,该方法包括:分离所采集到的混合信号以获得第一信号和第二信号;选择第一信号和第二信号中的一个作为当前参考信号,另一个作为当前期望信号;以及基于所选择的当前参考信号和当前期望信号执行自适应滤波。通过该方法和装置,能够在无法直接从硬件获得参考信号的情况下显著地降低或消除噪声。