-
公开(公告)号:CN114974245A
公开(公告)日:2022-08-30
申请号:CN202210609847.4
申请日:2022-05-31
申请人: 南京地平线机器人技术有限公司
IPC分类号: G10L15/22 , G10L15/25 , G10L21/0216 , G10L21/0272 , G10L25/27 , H04L9/40 , G06T7/00
摘要: 本公开实施例公开了一种语音分离方法和装置、电子设备和存储介质,其中,该方法包括:获取空间区域内的第一混合语音信号和第一图像序列;对第一图像序列进行图像质量检测,确定第一图像序列的图像质量;响应于第一图像序列的图像质量满足预设标准,利用第一语音分离模型对输入的第一混合语音信号和第一图像序列进行处理,获得第一语音信号;响应于第一图像序列的图像质量不满足预设标准,利用第二语音分离模型对第一混合语音信号进行处理,获得第二语音信号。本公开实施例可以对第一混合语音信号进行语音分离,并可以确定分离后语音信号的所属人物,进而可以根据权限信息确定是否响应分离后语音信号对车载设备的控制指令,用户体验好。
-
公开(公告)号:CN114332724A
公开(公告)日:2022-04-12
申请号:CN202111670781.1
申请日:2021-12-31
申请人: 南京地平线机器人技术有限公司
IPC分类号: G06V20/40 , G06V10/764 , G06V10/774
摘要: 本公开实施例公开了一种视频目标的状态检测方法和装置、电子设备及存储介质,其中,方法包括:基于预先训练的分类模型,确定待检测视频的每帧图像中关于目标的状态的正向置信度;基于多个不同长度的窗口,分别确定每个窗口对应的待检测视频中的多帧图像关于所述目标的状态的融合正向置信度;基于每个窗口的融合正向置信度与对应的融合正向置信度阈值,确定待检测视频中目标的状态检测结果。本公开实施例可以能够提高系统的响应灵敏度。
-