-
公开(公告)号:CN115171692A
公开(公告)日:2022-10-11
申请号:CN202210837475.0
申请日:2022-07-15
申请人: 南京地平线机器人技术有限公司
发明人: 朱长宝
摘要: 本公开提供一种语音交互方法和装置,通过接收各电子设备中至少一个唤醒设备响应于用户的语音指令发送的唤醒信号,从各电子设备中确定至少一个目标设备,并指示各目标设备识别语音指令的语义得到语义信息,以根据语义信息,确定各目标设备中的第一应答设备,以使第一应答设备对语音指令做出响应。解决了多个设备难以与用户进行准确的交互的问题,有利于用户体验。
-
公开(公告)号:CN114974245A
公开(公告)日:2022-08-30
申请号:CN202210609847.4
申请日:2022-05-31
申请人: 南京地平线机器人技术有限公司
IPC分类号: G10L15/22 , G10L15/25 , G10L21/0216 , G10L21/0272 , G10L25/27 , H04L9/40 , G06T7/00
摘要: 本公开实施例公开了一种语音分离方法和装置、电子设备和存储介质,其中,该方法包括:获取空间区域内的第一混合语音信号和第一图像序列;对第一图像序列进行图像质量检测,确定第一图像序列的图像质量;响应于第一图像序列的图像质量满足预设标准,利用第一语音分离模型对输入的第一混合语音信号和第一图像序列进行处理,获得第一语音信号;响应于第一图像序列的图像质量不满足预设标准,利用第二语音分离模型对第一混合语音信号进行处理,获得第二语音信号。本公开实施例可以对第一混合语音信号进行语音分离,并可以确定分离后语音信号的所属人物,进而可以根据权限信息确定是否响应分离后语音信号对车载设备的控制指令,用户体验好。
-
公开(公告)号:CN108433318B
公开(公告)日:2021-07-30
申请号:CN201810258176.5
申请日:2018-03-27
申请人: 南京地平线机器人技术有限公司
发明人: 朱长宝
摘要: 公开了一种电吹风和控制电吹风的方法。该电吹风可以包括:摄像头,被配置为实时地采集图像;控制器,被配置为分析所采集的图像以识别头发特征,以及根据所识别出的头发特征来确定所述电吹风的送风模式;以及送风机构,被配置为根据由所确定的送风模式进行送风。该电吹风能够根据头发的情况自动地选择和调整送风模式。
-
公开(公告)号:CN108433318A
公开(公告)日:2018-08-24
申请号:CN201810258176.5
申请日:2018-03-27
申请人: 南京地平线机器人技术有限公司
发明人: 朱长宝
摘要: 公开了一种电吹风和控制电吹风的方法。该电吹风可以包括:摄像头,被配置为实时地采集图像;控制器,被配置为分析所采集的图像以识别头发特征,以及根据所识别出的头发特征来确定所述电吹风的送风模式;以及送风机构,被配置为根据由所确定的送风模式进行送风。该电吹风能够根据头发的情况自动地选择和调整送风模式。
-
公开(公告)号:CN110738990B
公开(公告)日:2022-03-25
申请号:CN201810796701.9
申请日:2018-07-19
申请人: 南京地平线机器人技术有限公司
IPC分类号: G10L15/20
摘要: 公开了一种识别语音的方法和装置,该方法包括:将输入的声音信号分离为至少两个分离信号;生成在当前帧时的降噪信号;对在当前帧时的每个关注信号执行初步识别;以及根据在当前帧时的每个关注信号在当前帧时的识别得分执行识别判决。本公开的方法和装置将阵列信号处理和语音识别深度地融合在一起并采用多路识别,使得即使在信噪比很低的情况下也能够获得很好的识别率。
-
公开(公告)号:CN107843871B
公开(公告)日:2020-07-24
申请号:CN201711077881.7
申请日:2017-11-06
申请人: 南京地平线机器人技术有限公司
发明人: 朱长宝
IPC分类号: G01S3/802 , G10L21/0216 , G10K11/34
摘要: 公开了一种声源定向方法、装置和电子设备。所述方法包括:获取声源定向模板,所述声源定向模板与多个固定滤波器相关联;接收待测声源信号;通过所述多个固定滤波器对所述待测声源信号进行滤波以获得滤波后的所述待测声源信号的第一频域参数;以及,匹配所述第一频域参数和所述声源定向模板以定向所述待测声源信号。因此,可以实现高精度和低复杂度的声源定向操作。
-
公开(公告)号:CN110890098A
公开(公告)日:2020-03-17
申请号:CN201811045478.0
申请日:2018-09-07
申请人: 南京地平线机器人技术有限公司
IPC分类号: G10L21/0208 , G10L21/0272
摘要: 公开了一种盲信号分离方法、装置和电子设备。该方法包括:使用复数高斯分布对声源进行建模,以确定声源的概率密度分布;基于所述概率密度分布来更新盲信号分离模型;以及,使用更新后的盲信号分离模型对音频信号进行分离,以获得多个分离的输出信号。这样,可以通过基于复数高斯分布获得的声源的概率密度分布更新盲信号分离模型,从而有效地提升盲信号分离算法在特定场景下的分离性能。
-
公开(公告)号:CN107993671A
公开(公告)日:2018-05-04
申请号:CN201711258117.X
申请日:2017-12-04
申请人: 南京地平线机器人技术有限公司
IPC分类号: G10L21/0208 , H04N5/232
摘要: 公开了一种声音处理方法、装置、电子设备和计算机可读存储介质。所述方法包括:根据麦克风阵列所采集的多个声音信号和摄像头所采集的图像信号确定声音预处理方向;基于所述声音预处理方向选择预处理滤波系数;使用所述预处理滤波系数对所述多个声音信号进行预处理滤波,以得到初始信号源信号和初始噪声源信号;确定自适应滤波系数;以及,使用所述自适应滤波系数来对所述初始信号源信号和所述初始噪声源信号进行自适应滤波,以得到增强信号源信号。可以增强信号源信号,从而提高声音的音质。
-
公开(公告)号:CN107843871A
公开(公告)日:2018-03-27
申请号:CN201711077881.7
申请日:2017-11-06
申请人: 南京地平线机器人技术有限公司
发明人: 朱长宝
IPC分类号: G01S3/802 , G10L21/0216 , G10K11/34
CPC分类号: G01S3/802 , G10K11/343 , G10L21/0216 , G10L2021/02166
摘要: 公开了一种声源定向方法、装置和电子设备。所述方法包括:获取声源定向模板,所述声源定向模板与多个固定滤波器相关联;接收待测声源信号;通过所述多个固定滤波器对所述待测声源信号进行滤波以获得滤波后的所述待测声源信号的第一频域参数;以及,匹配所述第一频域参数和所述声源定向模板以定向所述待测声源信号。因此,可以实现高精度和低复杂度的声源定向操作。
-
公开(公告)号:CN110890098B
公开(公告)日:2022-05-10
申请号:CN201811045478.0
申请日:2018-09-07
申请人: 南京地平线机器人技术有限公司
IPC分类号: G10L21/0208 , G10L21/0272
摘要: 公开了一种盲信号分离方法、装置和电子设备。该方法包括:使用复数高斯分布对声源进行建模,以确定声源的概率密度分布;基于所述概率密度分布来更新盲信号分离模型;以及,使用更新后的盲信号分离模型对音频信号进行分离,以获得多个分离的输出信号。这样,可以通过基于复数高斯分布获得的声源的概率密度分布更新盲信号分离模型,从而有效地提升盲信号分离算法在特定场景下的分离性能。
-
-
-
-
-
-
-
-
-