声纹识别的方法和装置
    4.
    发明授权

    公开(公告)号:CN113327620B

    公开(公告)日:2024-10-11

    申请号:CN202010132716.2

    申请日:2020-02-29

    Inventor: 郎玥 徐嘉明

    Abstract: 本申请提供一种声纹识别的方法和装置。该声纹识别的方法包括:获取待识别用户的待识别语音信号;对所述待识别语音信号进行情感识别,获取所述待识别语音信号对应的第一情绪;获取已注册用户在所述第一情绪对应的声纹模板,当第一情绪对应不同情绪时,所述不同情绪对应的声纹模板不同;根据所述待识别语音信号和所述声纹模板,判断所述待识别用户是否为所述已注册用户。因此,本申请实施例通过将相同情绪下的待识别语音信号与声纹模板进行匹配,能够有助于降低用户的情绪波动对声纹识别的影响,从而增强声纹识别的鲁棒性。

    语音唤醒的方法、装置、设备、存储介质及程序产品

    公开(公告)号:CN115731927A

    公开(公告)日:2023-03-03

    申请号:CN202111005443.6

    申请日:2021-08-30

    Abstract: 本申请实施例公开了一种语音唤醒的方法、装置、设备、存储介质及程序产品,属于语音识别技术领域。在本申请实施例中,通过骨导麦克采集骨导信号进行语音检测,能够保证低功耗。另外,考虑到由于语音检测的延迟可能会导致采集的气导信号丢头,从而未包含声源输入的命令词的完整信息,而骨导麦克采集的骨导信号包含声源输入的命令词信息,即骨导信号未丢头,因此本方案基于骨导信号进行唤醒词的检测。这样,唤醒词的识别准确率较高,语音唤醒的准确度较高。

    用于处理音频信号的方法和移动装置

    公开(公告)号:CN105917674B

    公开(公告)日:2019-11-22

    申请号:CN201380080499.5

    申请日:2013-10-30

    Abstract: 一种用于处理音频信号的方法(900),所述方法包含:将包括空间信息的音频信号(602a,602b)分解(901)成一组音频信号成分;以及根据第一处理方案(603)处理(902)所述音频信号成分的组的第一子集(606a)且根据不同于所述第一处理方案(603)的第二处理方案(609)处理所述音频信号成分的组的第二子集(606),其中所述第一子集(606a)包括对应于至少一个正面信号源(M)的音频信号成分并且所述第二子集(606)包括对应于至少一个环境信号源(SL,SR)的音频信号成分;其中所述第二处理方案(609)是基于串扰抵销。

    多声道音频编码器以及用于对多声道音频信号进行编码的方法

    公开(公告)号:CN104205211B

    公开(公告)日:2016-11-30

    申请号:CN201280072151.7

    申请日:2012-04-05

    Abstract: 本发明涉及一种用于确定多声道音频信号的多个音频声道信号(x1、x2)的音频声道信号(x1)的编码参数(ITD)的方法(100),每个音频声道信号(x1、x2)具有音频声道信号值(x1[n]、x2[n]),所述方法包括:确定(101)音频声道信号(x1)的音频声道信号值(x1[n])的频率变换(x1[k]);确定(103)参考音频信号(x2)的参考音频信号值(x2[n])的频率变换(x2[k]),其中所述参考音频信号是所述多个音频声道信号中的另一个音频声道信号(x2),或是从所述多个音频声道信号中的至少两个音频声道信号(x1、x2)导出的下混音频信号;确定(105)针对子频带的子集的至少每个子频带(b)的声道间差值(ICD[b]),每一声道间差值是指在所述声道间差值所关联的相应子频带(b)中的所述音频声道信号的频带限制信号部分与所述参考音频信号的频带限制信号部分之间的相位差(IPD[b])或时间差(ITD[b]);基于所述声道间差值(ICD[b])的正值来确定(107)第一平均值(ITDmean_pos),并且基于声道间差值(ICD[b])的负值来确定第二平均值(ITDmean_neg);并且基于所述第一平均值和所述第二平均值来确定(109)编码参数(ITD)。

    用于处理音频信号的方法和移动装置

    公开(公告)号:CN105917674A

    公开(公告)日:2016-08-31

    申请号:CN201380080499.5

    申请日:2013-10-30

    Abstract: 一种用于处理音频信号的方法(900),所述方法包含:将包括空间信息的音频信号(602a,602b)分解(901)成一组音频信号成分;以及根据第一处理方案(603)处理(902)所述音频信号成分的组的第一子集(606a)且根据不同于所述第一处理方案(603)的第二处理方案(609)处理所述音频信号成分的组的第二子集(606),其中所述第一子集(606a)包括对应于至少一个正面信号源(M)的音频信号成分并且所述第二子集(606)包括对应于至少一个环境信号源(SL,SR)的音频信号成分;其中所述第二处理方案(609)是基于串扰抵销。

    用于确定立体声信号的方法

    公开(公告)号:CN104981866A

    公开(公告)日:2015-10-14

    申请号:CN201380072679.9

    申请日:2013-01-04

    Abstract: 本发明涉及一种用于确定输出立体声信号(Y1、Y2)的方法(200),其包括:基于第一输入音频信道信号(m1)和第二输入音频信道信号(m2)的经滤波版本的差确定(201)第一差分信号(x1)以及基于所述第二输入音频信道信号(m2)和所述第一输入音频信道信号(m1)的经滤波版本的差确定第二差分信号(x2);基于所述第一差分信号(x1)确定(203)第一功率谱(P1)以及基于所述第二差分信号(x2)确定第二功率谱(P2);确定(205)第一加权函数(W1)和第二加权函数(W2)作为所述第一功率谱(P1)和所述第二功率谱(P2)的函数;其中所述第一加权函数(W1)和所述第二加权函数(W2)包括指数函数;以及通过所述第一加权函数(W1)来滤波(207)第一信号以获得所述输出立体声信号(Y1、Y2)的第一输出音频信道信号(Y1),第一信号代表所述第一输入音频信道信号(m1)和所述第二输入音频信道信号(m2)的第一组合以及通过所述第二加权函数(W2)来滤波第二信号以获得所述输出立体声信号(Y1、Y2)的第二输出音频信道信号(Y2),第二信号代表所述第一输入音频信道信号(m1)和所述第二输入音频信道信号(m2)的第二组合。

    用于参数空间音频编码和解码的方法、参数空间音频编码器和参数空间音频解码器

    公开(公告)号:CN103493127B

    公开(公告)日:2015-03-11

    申请号:CN201280003212.4

    申请日:2012-04-05

    CPC classification number: G10L19/008 H04S3/00

    Abstract: 本文提供一种用于对多信道音频信号进行空间音频编码的方法,所述多信道音频信号包括多个音频信道信号,所述方法包括:对所述多个音频信道信号中的一个音频信道信号计算至少两个不同的空间编码参数,其中所述至少两个不同的空间编码参数是至少两种不同类型的空间编码参数并且关于参考音频信号进行计算,其中所述参考音频信号是所述多个音频信道信号中的另一个音频信道信号或从所述多个音频信道信号中的至少两个音频信道信号导出的下混音频信号;基于所述计算得出的空间编码参数的值来选择与所述音频信道信号相关联的所述至少两个不同的空间编码参数中的至少一个空间编码参数;将所述选定的空间编码参数的量化表示计入音频比特流(1)的参数段(1b)中;以及在所述音频比特流(1)的参数段(1b)中设置参数类型标志,从而指示计入所述音频比特流(1)中的所述选定的空间编码参数的类型。

Patent Agency Ranking