-
公开(公告)号:CN107980225A
公开(公告)日:2018-05-01
申请号:CN201580078950.9
申请日:2015-04-17
Applicant: 华为技术有限公司 , 埃朗根-纽伦堡弗里德里希-亚力山大大学
Abstract: 一种使用驱动信号驱动扬声器阵列的波场合成装置(100、800),所述装置包括:声场合成器(110、810),用于产生声场驱动信号,所述声场驱动信号用于使所述扬声器(210)阵列在一个或多个音频区(220、230、520、620、720、730)处产生一个或多个声场;双声道渲染器(120、820),用于产生双声道驱动信号,所述双声道驱动信号用于使所述扬声器阵列在至少两个位置处产生特定声压,其中所述至少两个位置基于检测到的听众位置和/或方向确定;以及决策单元(130、830),用于决定是使用所述声场合成器还是使用所述双声道渲染器来产生所述驱动信号。
-
公开(公告)号:CN107251579B
公开(公告)日:2019-11-26
申请号:CN201580075816.3
申请日:2015-04-08
Applicant: 华为技术有限公司 , 埃朗根-纽伦堡弗里德里希-亚力山大大学
IPC: H04S7/00
Abstract: 一种使用驱动信号驱动扬声器阵列以在一个或多个音频区产生一个或多个本地波场的本地波场合成装置(200),所述装置包括:确定模块(40、210),用于确定多个控制点处的所需声压和所需粒子速度向量;计算模块(60、212),用于基于一组滤波参数计算所述多个控制点处的声压和粒子速度向量;优化模块(220),用于通过以下方式计算一组最佳滤波参数:将计算出的声压向所述所需声压以及将计算出的粒子速度向量向所述所需粒子速度向量联合优化;以及生成器模块(224),用于基于所述一组最佳滤波参数产生所述驱动信号,其中所述多个控制点位于所述一个或多个音频区周围的一个或多个等值线上。
-
公开(公告)号:CN107251579A
公开(公告)日:2017-10-13
申请号:CN201580075816.3
申请日:2015-04-08
Applicant: 华为技术有限公司 , 埃朗根-纽伦堡弗里德里希-亚力山大大学
IPC: H04S7/00
CPC classification number: H04S7/302 , H04R5/02 , H04R2201/403 , H04R2499/13 , H04S7/30 , H04S7/301 , H04S2420/13
Abstract: 一种使用驱动信号驱动扬声器阵列以在一个或多个音频区产生一个或多个本地波场的本地波场合成装置(200),所述装置包括:确定模块(40、210),用于确定多个控制点处的所需声压和所需粒子速度向量;计算模块(60、212),用于基于一组滤波参数计算所述多个控制点处的声压和粒子速度向量;优化模块(220),用于通过以下方式计算一组最佳滤波参数:将计算出的声压向所述所需声压以及将计算出的粒子速度向量向所述所需粒子速度向量联合优化;以及生成器模块(224),用于基于所述一组最佳滤波参数产生所述驱动信号,其中所述多个控制点位于所述一个或多个音频区周围的一个或多个等值线上。
-
公开(公告)号:CN113327620B
公开(公告)日:2024-10-11
申请号:CN202010132716.2
申请日:2020-02-29
Applicant: 华为技术有限公司
Abstract: 本申请提供一种声纹识别的方法和装置。该声纹识别的方法包括:获取待识别用户的待识别语音信号;对所述待识别语音信号进行情感识别,获取所述待识别语音信号对应的第一情绪;获取已注册用户在所述第一情绪对应的声纹模板,当第一情绪对应不同情绪时,所述不同情绪对应的声纹模板不同;根据所述待识别语音信号和所述声纹模板,判断所述待识别用户是否为所述已注册用户。因此,本申请实施例通过将相同情绪下的待识别语音信号与声纹模板进行匹配,能够有助于降低用户的情绪波动对声纹识别的影响,从而增强声纹识别的鲁棒性。
-
公开(公告)号:CN115731927A
公开(公告)日:2023-03-03
申请号:CN202111005443.6
申请日:2021-08-30
Applicant: 华为技术有限公司
Abstract: 本申请实施例公开了一种语音唤醒的方法、装置、设备、存储介质及程序产品,属于语音识别技术领域。在本申请实施例中,通过骨导麦克采集骨导信号进行语音检测,能够保证低功耗。另外,考虑到由于语音检测的延迟可能会导致采集的气导信号丢头,从而未包含声源输入的命令词的完整信息,而骨导麦克采集的骨导信号包含声源输入的命令词信息,即骨导信号未丢头,因此本方案基于骨导信号进行唤醒词的检测。这样,唤醒词的识别准确率较高,语音唤醒的准确度较高。
-
公开(公告)号:CN105917674B
公开(公告)日:2019-11-22
申请号:CN201380080499.5
申请日:2013-10-30
Applicant: 华为技术有限公司
Abstract: 一种用于处理音频信号的方法(900),所述方法包含:将包括空间信息的音频信号(602a,602b)分解(901)成一组音频信号成分;以及根据第一处理方案(603)处理(902)所述音频信号成分的组的第一子集(606a)且根据不同于所述第一处理方案(603)的第二处理方案(609)处理所述音频信号成分的组的第二子集(606),其中所述第一子集(606a)包括对应于至少一个正面信号源(M)的音频信号成分并且所述第二子集(606)包括对应于至少一个环境信号源(SL,SR)的音频信号成分;其中所述第二处理方案(609)是基于串扰抵销。
-
公开(公告)号:CN104205211B
公开(公告)日:2016-11-30
申请号:CN201280072151.7
申请日:2012-04-05
Applicant: 华为技术有限公司
IPC: G10L19/008
Abstract: 本发明涉及一种用于确定多声道音频信号的多个音频声道信号(x1、x2)的音频声道信号(x1)的编码参数(ITD)的方法(100),每个音频声道信号(x1、x2)具有音频声道信号值(x1[n]、x2[n]),所述方法包括:确定(101)音频声道信号(x1)的音频声道信号值(x1[n])的频率变换(x1[k]);确定(103)参考音频信号(x2)的参考音频信号值(x2[n])的频率变换(x2[k]),其中所述参考音频信号是所述多个音频声道信号中的另一个音频声道信号(x2),或是从所述多个音频声道信号中的至少两个音频声道信号(x1、x2)导出的下混音频信号;确定(105)针对子频带的子集的至少每个子频带(b)的声道间差值(ICD[b]),每一声道间差值是指在所述声道间差值所关联的相应子频带(b)中的所述音频声道信号的频带限制信号部分与所述参考音频信号的频带限制信号部分之间的相位差(IPD[b])或时间差(ITD[b]);基于所述声道间差值(ICD[b])的正值来确定(107)第一平均值(ITDmean_pos),并且基于声道间差值(ICD[b])的负值来确定第二平均值(ITDmean_neg);并且基于所述第一平均值和所述第二平均值来确定(109)编码参数(ITD)。
-
公开(公告)号:CN105917674A
公开(公告)日:2016-08-31
申请号:CN201380080499.5
申请日:2013-10-30
Applicant: 华为技术有限公司
Abstract: 一种用于处理音频信号的方法(900),所述方法包含:将包括空间信息的音频信号(602a,602b)分解(901)成一组音频信号成分;以及根据第一处理方案(603)处理(902)所述音频信号成分的组的第一子集(606a)且根据不同于所述第一处理方案(603)的第二处理方案(609)处理所述音频信号成分的组的第二子集(606),其中所述第一子集(606a)包括对应于至少一个正面信号源(M)的音频信号成分并且所述第二子集(606)包括对应于至少一个环境信号源(SL,SR)的音频信号成分;其中所述第二处理方案(609)是基于串扰抵销。
-
公开(公告)号:CN104981866A
公开(公告)日:2015-10-14
申请号:CN201380072679.9
申请日:2013-01-04
Applicant: 华为技术有限公司
IPC: G10L19/008
CPC classification number: H04S7/301 , H04R1/406 , H04R3/005 , H04R5/027 , H04R5/04 , H04S1/002 , H04S2400/09 , H04S2400/15
Abstract: 本发明涉及一种用于确定输出立体声信号(Y1、Y2)的方法(200),其包括:基于第一输入音频信道信号(m1)和第二输入音频信道信号(m2)的经滤波版本的差确定(201)第一差分信号(x1)以及基于所述第二输入音频信道信号(m2)和所述第一输入音频信道信号(m1)的经滤波版本的差确定第二差分信号(x2);基于所述第一差分信号(x1)确定(203)第一功率谱(P1)以及基于所述第二差分信号(x2)确定第二功率谱(P2);确定(205)第一加权函数(W1)和第二加权函数(W2)作为所述第一功率谱(P1)和所述第二功率谱(P2)的函数;其中所述第一加权函数(W1)和所述第二加权函数(W2)包括指数函数;以及通过所述第一加权函数(W1)来滤波(207)第一信号以获得所述输出立体声信号(Y1、Y2)的第一输出音频信道信号(Y1),第一信号代表所述第一输入音频信道信号(m1)和所述第二输入音频信道信号(m2)的第一组合以及通过所述第二加权函数(W2)来滤波第二信号以获得所述输出立体声信号(Y1、Y2)的第二输出音频信道信号(Y2),第二信号代表所述第一输入音频信道信号(m1)和所述第二输入音频信道信号(m2)的第二组合。
-
公开(公告)号:CN103493127B
公开(公告)日:2015-03-11
申请号:CN201280003212.4
申请日:2012-04-05
Applicant: 华为技术有限公司
IPC: G10L19/008 , H04S3/00
CPC classification number: G10L19/008 , H04S3/00
Abstract: 本文提供一种用于对多信道音频信号进行空间音频编码的方法,所述多信道音频信号包括多个音频信道信号,所述方法包括:对所述多个音频信道信号中的一个音频信道信号计算至少两个不同的空间编码参数,其中所述至少两个不同的空间编码参数是至少两种不同类型的空间编码参数并且关于参考音频信号进行计算,其中所述参考音频信号是所述多个音频信道信号中的另一个音频信道信号或从所述多个音频信道信号中的至少两个音频信道信号导出的下混音频信号;基于所述计算得出的空间编码参数的值来选择与所述音频信道信号相关联的所述至少两个不同的空间编码参数中的至少一个空间编码参数;将所述选定的空间编码参数的量化表示计入音频比特流(1)的参数段(1b)中;以及在所述音频比特流(1)的参数段(1b)中设置参数类型标志,从而指示计入所述音频比特流(1)中的所述选定的空间编码参数的类型。
-
-
-
-
-
-
-
-
-