一种在线多输入多输出语音信号的去混响方法及系统

    公开(公告)号:CN118057528A

    公开(公告)日:2024-05-21

    申请号:CN202211448747.4

    申请日:2022-11-18

    发明人: 栾天祥

    摘要: 本发明提供一种在线多输入多输出语音信号的去混响方法及系统,该方法包括:对麦克风阵列接收信号进行频域转换,获取多通道语音频域信号;基于多通道语音频域信号的滤波器系数阶数,获取滤波器系数矩阵,根据更新步长,对滤波器系数矩阵进行更新,获取更新后的滤波器系数矩阵;根据更新后的滤波器系数矩阵,对多通道语音频域信号进行去混响处理,获取去混响后的多通道语音频域信号;根据去混响后的多通道语音频域信号和补偿系数,确定多通道语音频域信号去混响结果,其中,补偿系数是通过补偿模型输出得到,补偿模型是由样本误差去混响信号和样本无混响信号,对神经网络进行训练得到。本发明可实时在线去混响,降低运算复杂度,实现计算量可控。

    语音聚类方法、装置、存储介质及电子装置

    公开(公告)号:CN116013315A

    公开(公告)日:2023-04-25

    申请号:CN202211511494.0

    申请日:2022-11-29

    发明人: 栾天祥

    IPC分类号: G10L17/02 G10L17/18

    摘要: 本申请公开了一种语音聚类方法、装置、存储介质及电子装置,涉及智慧家庭技术领域,该语音聚类方法包括:确定获取的目标语音的语音特征的编码序列;确定编码序列的标签向量,其中,标签向量用于表示目标语音的连续性;将标签向量和编码序列输入第一神经网络模型,得到第一神经网络模型输出的高维特征向量,其中,高维特征向量用于表示发出目标语音的对象所属的类别,第一神经网络模型中包括多层网络编码器;将高维特征向量和高维特征向量的标签输入第二神经网络模型,得到第二神经网络模型输出的目标概率值,其中,目标概率值用于表示目标语音与其他语音属于同一类别的概率,第二神经网络模型中包括多层网络编码器,其他语音是已进行语音类别聚类的语音。

    智能设备的交互方法和装置、存储介质及电子装置

    公开(公告)号:CN116418611A

    公开(公告)日:2023-07-11

    申请号:CN202111662830.7

    申请日:2021-12-30

    IPC分类号: H04L12/28

    摘要: 本申请公开了一种智能设备的交互方法和装置、存储介质及电子装置,其中,上述方法包括:获取使用对象所发出的目标交互数据,其中,目标交互数据为第一模态的交互数据,目标交互数据用于触发第一设备执行第一交互操作;在根据目标交互数据未获取到与第一交互操作对应的交互参数的情况下,获取与目标交互数据对应的目标参考数据,其中,目标参考数据为第二模态的参考数据,目标参考数据用于辅助确定与第一交互操作对应的交互参数;对目标交互数据和目标参考数据执行融合操作,得到与第一交互操作对应的第一交互参数;按照第一交互参数控制第一设备执行第一交互操作。

    智能设备的定位方法、存储介质及电子装置

    公开(公告)号:CN117675849A

    公开(公告)日:2024-03-08

    申请号:CN202211064741.7

    申请日:2022-08-31

    摘要: 本申请公开了一种智能设备的定位方法、存储介质及电子装置,涉及智能家居/智慧家庭技术领域,其中,上述方法包括:响应于对待定位设备的设备定位请求,控制待定位设备的一组关联设备中的每个关联设备依次播报对应的预设音频;从一组关联设备中确定与待定位设备接收到的目标接收音频对应的目标关联设备,其中,目标接收音频与目标关联设备播报的预设音频对应;根据目标关联设备的设备位置、以及待定位设备与目标关联设备的相对位置,对待定位设备进行定位,其中,目标关联设备与待定位设备的相对位置是根据目标接收音频确定的。解决了相关技术中的智能设备的定位方式存在由于人工辨音不准确导致的设备定位的效率低的问题。

    目标对象的身份确定方法和装置、存储介质及电子装置

    公开(公告)号:CN114121020A

    公开(公告)日:2022-03-01

    申请号:CN202111264517.8

    申请日:2021-10-28

    发明人: 栾天祥

    IPC分类号: G10L17/02 G10L17/04 G10L17/06

    摘要: 本发明公开了一种目标对象的身份确定方法和装置、存储介质及电子装置,其中上述方法应用于智能语音设备,所述智能语音设备配置有聚类分类器,上述方法包括:通过语音特征提取器对第一目标对象发出的第一语音数据进行特征提取,得到所述第一语音数据的第一语音特征;将所述第一语音特征输入所述聚类分类器,得到所述第一语音特征对应的所述第一目标对象的目标身份类型;将所述目标身份类型发送至云端服务器,并接收所述云端服务器根据所述目标身份类型返回的所述第一目标对象的身份信息,采用上述技术方案,解决了现有的身份识别系统,需要用户预先进行注册,进而会导致设备的复杂性和设备的不智能性。

    一种分布式唤醒方法及系统
    19.
    发明公开

    公开(公告)号:CN113744735A

    公开(公告)日:2021-12-03

    申请号:CN202111022312.9

    申请日:2021-09-01

    发明人: 栾天祥

    摘要: 本发明提供一种分布式唤醒方法及系统,应用于第一语音设备,包括:根据用户唤醒语音确定第一音频检测信号,并接收至少一个第二语音设备发送的估计参考信号;根据至少一个估计参考信号和第一音频检测信号,确定噪声估计能量;根据噪声估计能量,确定接收到的唤醒语音能量,并基于唤醒语音能量确定唤醒状态。本发明提供的分布式唤醒方法及系统,通过引入第二语音设备的估计参考信号,能够有效抑制第一语音设备自噪声对人工智能语音设备计算分布式唤醒距离估计值的影响,在运算量低的同时,在人工智能语音设备自噪场景中大幅提高分布式唤醒声源距离计算的准确性,进而提高分布式唤醒的性能和实际应用广泛性。

    确定电子设备的方法、装置、存储介质及电子装置

    公开(公告)号:CN113488031A

    公开(公告)日:2021-10-08

    申请号:CN202110742317.2

    申请日:2021-06-30

    IPC分类号: G10L15/20 G10L15/22 G06F17/16

    摘要: 本发明公开了一种确定电子设备的方法、装置、存储介质及电子装置。其中,该方法包括:获取多个电子设备所采集的语音信号,每个电子设备包括至少一个麦克风阵列;基于每个电子设备所采集的语音信号,确定每个电子设备所采集的语音信号对应的混响能量占比,其中,混响能量占比表征电子设备所采集的语音信号中,混响能量分量与直达能量分量的关系;根据多个电子设备的混响能量占比,从多个电子设备中确定目标设备。本发明解决了现有技术中由于分布式唤醒方法通过去混响、降噪的方式来抑制环境影响对距离估计的影响造成分布式唤醒方法运算量大、性能差和实际应用价值小的技术问题。