-
公开(公告)号:CN107749305B
公开(公告)日:2021-08-24
申请号:CN201710910848.1
申请日:2017-09-29
Applicant: 百度在线网络技术(北京)有限公司
IPC: G10L21/0208 , G10L19/008 , G10L25/78
Abstract: 本发明提出一种语音处理方法及其装置,其中,方法包括:采集N路的当前语音帧;对每一路的当前语音帧进行子带分解,获取当前语音帧的M个子带信号;其中,N,M为正整数;从各路的M个子带信号中提取频带相同的子带信号;针对每个频带,对频带下的N路子带信号进行波束形成,得到一路的第一语音信号;对每个频带下的第一语音信号进行子带合成,获取当前语音帧的输出信号。该方法通过对采集的每路语音帧进行子带分解,和将相同频带下的子带信号进行波束形成,再子带合成出输出信号,不仅可以消除输出信号中的混叠,而且提高了输出信号的信噪比,能够输出高质量的语音信号,提高语音定位的准确率。
-
公开(公告)号:CN107481731B
公开(公告)日:2021-01-22
申请号:CN201710648063.1
申请日:2017-08-01
Applicant: 百度在线网络技术(北京)有限公司
IPC: G10L21/0216 , G10L21/0264
Abstract: 本申请提供一种语音数据增强方法及系统,所述方法包括:估计远场环境下的冲激响应函数;利用所述冲激响应函数,对近场语音训练数据进行滤波处理;对滤波处理后得到的数据进行加噪处理,得到远场语音训练数据。能够避免现有技术中录制远场语音训练数据需要花费大量的时间成本和经济成本的问题;减少获取远场语音训练数据的时间和经济成本。
-
公开(公告)号:CN105427860B
公开(公告)日:2019-09-03
申请号:CN201510768005.3
申请日:2015-11-11
Applicant: 百度在线网络技术(北京)有限公司
IPC: G10L15/06
Abstract: 本发明提出一种远场语音识别方法和装置,该远场语音识别方法包括:将麦克风阵列接收的待识别的远场语音进行自适应波束形成处理,获得一路待识别的信号;通过远场识别的声学模型对所述待识别的信号进行识别。本发明对远场语音进行识别时所采用的远场识别的声学模型能够与远场识别的输入语音信号实现真正匹配,从而可以提升远场语音识别的识别性能。
-
公开(公告)号:CN107749305A
公开(公告)日:2018-03-02
申请号:CN201710910848.1
申请日:2017-09-29
Applicant: 百度在线网络技术(北京)有限公司
IPC: G10L21/0208 , G10L19/008 , G10L25/78
CPC classification number: G10L21/0208 , G10L19/008 , G10L25/78
Abstract: 本发明提出一种语音处理方法及其装置,其中,方法包括:采集N路的当前语音帧;对每一路的当前语音帧进行子带分解,获取当前语音帧的M个子带信号;其中,N,M为正整数;从各路的M个子带信号中提取频带相同的子带信号;针对每个频带,对频带下的N路子带信号进行波束形成,得到一路的第一语音信号;对每个频带下的第一语音信号进行子带合成,获取当前语音帧的输出信号。该方法通过对采集的每路语音帧进行子带分解,和将相同频带下的子带信号进行波束形成,再子带合成出输出信号,不仅可以消除输出信号中的混叠,而且提高了输出信号的信噪比,能够输出高质量的语音信号,提高语音定位的准确率。
-
公开(公告)号:CN107481731A
公开(公告)日:2017-12-15
申请号:CN201710648063.1
申请日:2017-08-01
Applicant: 百度在线网络技术(北京)有限公司
IPC: G10L21/0216 , G10L21/0264
Abstract: 本申请提供一种语音数据增强方法及系统,所述方法包括:估计远场环境下的冲激响应函数;利用所述冲激响应函数,对近场语音训练数据进行滤波处理;对滤波处理后得到的数据进行加噪处理,得到远场语音训练数据。能够避免现有技术中录制远场语音训练数据需要花费大量的时间成本和经济成本的问题;减少获取远场语音训练数据的时间和经济成本。
-
公开(公告)号:CN104935950B
公开(公告)日:2017-10-03
申请号:CN201510303031.9
申请日:2015-06-04
Applicant: 百度在线网络技术(北京)有限公司
IPC: H04N21/233 , H04N21/439 , G10L15/26
Abstract: 本发明提出一种用于获取节目信息的处理方法和系统,该用于获取节目信息的处理方法包括获取识别模型,所述识别模型是对接收的特征数据进行训练后得到的,所述特征数据是根据音频数据得到的,所述音频数据是从源数据流中获取的;接收要识别的特征数据,并根据所述识别模型对所述要识别的特征数据进行识别,得到识别结果,所述要识别的特征数据是根据要识别的音频数据得到的。该方法能够实现系统根据音频数据主动得到识别结果,降低对用户的依赖,提高效率和准确度。
-
公开(公告)号:CN104810021B
公开(公告)日:2017-08-18
申请号:CN201510236032.6
申请日:2015-05-11
Applicant: 百度在线网络技术(北京)有限公司
Abstract: 本发明提出一种应用于远场识别的前处理方法和装置,该应用于远场识别的前处理方法包括对要处理的声音信号进行固定波束形成处理,得到固定波束形成处理后的波束信号;对所述固定波束形成处理后的波束信号,进行声回波消除以及最优波束选择;根据声回波消除以及最优波束选择后的波束信号,得到应用于远场识别的前处理后的信号。该方法能够提高前处理效果,并且可选的,在声音信号数量较大时可以降低运算量。
-
公开(公告)号:CN104935950A
公开(公告)日:2015-09-23
申请号:CN201510303031.9
申请日:2015-06-04
Applicant: 百度在线网络技术(北京)有限公司
IPC: H04N21/233 , H04N21/439 , G10L15/26
CPC classification number: H04N21/233 , G10L15/26 , H04N21/4394
Abstract: 本发明提出一种用于获取节目信息的处理方法和系统,该用于获取节目信息的处理方法包括获取识别模型,所述识别模型是对接收的特征数据进行训练后得到的,所述特征数据是根据音频数据得到的,所述音频数据是从源数据流中获取的;接收要识别的特征数据,并根据所述识别模型对所述要识别的特征数据进行识别,得到识别结果,所述要识别的特征数据是根据要识别的音频数据得到的。该方法能够实现系统根据音频数据主动得到识别结果,降低对用户的依赖,提高效率和准确度。
-
公开(公告)号:CN104809159A
公开(公告)日:2015-07-29
申请号:CN201510142809.2
申请日:2015-03-27
Applicant: 百度在线网络技术(北京)有限公司
IPC: G06F17/30
Abstract: 本发明的目的是提供一种用于获得服务信息的方法和装置。根据本发明的方法包括:获取声音信息;根据所述声音信息,确定与所述声音信息对应的服务提供方;获取与所述服务提供方对应的服务信息,以提供给用户。本发明的优点在于:由于而无需经过搜索商户等中间过程,从而极大的提高了获取服务信息的效率,并且简化了用户的操作,并且能够节约用户的网络流量,对于用户体验有着非常显著的提升。并且,根据本发明的方案还可结合影像信息来确定服务提供方,从而进一步提升了确定服务提供方的精确性。
-
公开(公告)号:CN105957534B
公开(公告)日:2019-05-03
申请号:CN201610493493.6
申请日:2016-06-28
Applicant: 百度在线网络技术(北京)有限公司
IPC: G10L19/26
Abstract: 本申请公开了自适应滤波方法和自适应滤波器。该方法的一具体实施方式包括:自适应滤波器接收输入的语音信号;对语音信号进行滤波;根据噪声分量和语音分量,分别构建第一滤波器系数更新影响项和第二滤波器系数更新影响项;基于第一滤波器系数更新影响项、第二滤波器系数更新影响项,对自适应滤波器的滤波器系数进行更新。实现了将语音失真程度作为滤波器系数迭代更新的约束条件,使得自适应滤波器在正常工作的同时,兼顾语音失真程度,限制语音信号失真的大小。从而在确保语音信号增强的同时降低语音失真程度,进而消除在语音识别过程中,因语音信号过度失真而对语音识别效果的影响。
-
-
-
-
-
-
-
-
-