-
公开(公告)号:CN109065070A
公开(公告)日:2018-12-21
申请号:CN201810995309.7
申请日:2018-08-29
申请人: 昆明理工大学
摘要: 本发明涉及一种基于核函数的音频特征信号的降维方法,属于音频信号处理技术领域。本发明为对于音频信号的特征参量进行降维处理,在不丢弃音频特征信息量的同时使其达到所要求的降维效果,并将最后的降维数据进行可视化展示,同采用其他音频特征参量降维方法所得结果进行对比分析。本发明对音频特征参量进行降维主要是对音频系数域的线性预测系数、线性预测倒谱系数、梅尔频率倒谱系数进行降维处理,并将降维后的数据结果进行可视化展示。本发明的音频特征降维处理可用于广播信号监听,音频信号的快速识别处理。本发明算法简单,用非线性核函数表示高斯观测空间与隐空间的映射关系,避免了线性映射方法使用范围局限、降维效果不佳的弊端。
-
公开(公告)号:CN104835501B
公开(公告)日:2018-08-14
申请号:CN201510151793.1
申请日:2011-08-11
申请人: 株式会社NTT都科摩
摘要: 音频解码装置、音频解码方法、音频编码装置、音频编码方法。在一实施方式的音频解码装置中,具有:多个解码部,其执行彼此不同的音频解码处理而由码序列生成音频信号;提取部,其从具有分别包含音频信号的码序列的多个帧的流中,提取长时期编码处理信息,该长时期编码处理信息对于该多个帧是单一的长时期编码处理信息、且表示在该多个帧的码序列的生成中使用了共同的音频编码处理;以及选择部,其根据提取出所述长时期编码处理信息的情况,选择所述多个解码部中的、在所述多个帧的码序列的解码中共同使用的解码部,所述选择部根据由所述提取部提取出所述长时期编码处理信息的情况,选择所述多个解码部中的规定的解码部。
-
公开(公告)号:CN107993667A
公开(公告)日:2018-05-04
申请号:CN201711459702.6
申请日:2015-02-04
申请人: 皇家飞利浦有限公司
CPC分类号: G10L19/0204 , B41K1/04 , B41K1/10 , B41K1/12 , B41K1/38 , B41K1/40 , B41K1/42 , B41K3/56 , G10L19/00 , G10L21/038 , G10L25/21
摘要: 本发明涉及一种用于在解码过程中或改进过程中扩展音频信号的频带的方法,该方法包括获得在被称为低频带的第一频带中解码的信号的步骤。该方法为使得其包括以下步骤:从来自该低频带信号的信号中提取(E402)音调分量和环境信号;使用多个能量水平控制因子通过自适应混合对这些音调分量和该环境信号进行组合(E403)以获得被称为组合信号的音频信号;在高于该第一频带的至少一个第二频带上在该提取步骤之前对该低频带解码信号或在该组合步骤之后对该组合信号进行扩展(E401a)。本发明还涉及一种实现所描述的方法的频带扩展装置,并且涉及一种包括这种类型的装置的解码器。
-
公开(公告)号:CN105047206B
公开(公告)日:2018-04-27
申请号:CN201510187552.2
申请日:2011-01-06
申请人: LG电子株式会社
发明人: 吴贤午
IPC分类号: G11B20/10 , G11B27/034 , G11B27/30 , G11B27/34 , H04S3/00
CPC分类号: G10L19/00 , G10L19/008 , G11B27/034 , G11B27/3027 , G11B27/34 , H04S3/008 , H04S2400/01 , H04S2400/11
摘要: 公开了用于处理音频信号的设备及其方法。本发明包括:接收下混合信号和边信息;从边信息提取控制限制信息;接收用于控制至少一个对象信号的增益或平移的控制信息;基于控制信息和对象信息而不使用控制限制信息来产生第一多声道信息和第一下混合处理信息中的至少一个;以及,通过向下混合信号应用第一多声道信息和第一下混合处理信息中的至少一个来产生输出信号,其中,控制限制信息与指示控制信息的限制程度的参数相关。
-
公开(公告)号:CN107925391A
公开(公告)日:2018-04-17
申请号:CN201680050105.5
申请日:2016-09-26
申请人: 苹果公司
发明人: F·鲍姆加特
IPC分类号: H03G7/00
CPC分类号: H04R3/04 , G06F3/165 , G10L19/00 , G10L19/167 , H03G5/165 , H03G7/007 , H04N21/8113 , H04N21/84 , H04R2430/01
摘要: 本发明提供了使用包括针对音频内容的瞬时响度值的元数据在回放系统中对所接收的音频内容进行动态响度均衡。回放水平是从回放系统的用户音量设置导出的,并与分配给音频内容的混合水平进行比较。计算参数,该参数定义在利用经过滤的音频内容驱动扬声器之前对所述音频内容滤波的均衡滤波器,该参数基于该瞬时响度值,以及回放水平与所分配的混合水平的比较。还描述了其它实施方案并要求对其进行保护。
-
公开(公告)号:CN107787509A
公开(公告)日:2018-03-09
申请号:CN201680035796.1
申请日:2016-06-17
申请人: 三星电子株式会社
IPC分类号: G10L19/008 , G10L19/002 , G10L19/16 , H04S3/02
CPC分类号: G10L19/167 , G10L19/00 , G10L19/002 , G10L19/008 , G10L19/16 , H04S3/02
摘要: 根据用于实现技术目标的本发明实施例的一种处理音频信号的方法,包括以下步骤:接收使用MPEG环绕212(MPS212)编码的音频比特流;基于在格式转换器中定义的MPS212输出声道的呈现参数和所接收的音频比特流生成一个双声道元素(CPE)的内部声道信号;基于核心编解码器输出信道位置分配内部声道组;以及基于所分配的内部声道组和所生成的内部声道信号生成立体声声道输出信号。
-
公开(公告)号:CN107771346A
公开(公告)日:2018-03-06
申请号:CN201680035415.X
申请日:2016-06-17
申请人: 三星电子株式会社
IPC分类号: G10L19/008
CPC分类号: G10L19/008 , G10L19/00 , G10L19/002 , G10L19/16 , H04S3/00 , H04S2400/03 , H04S2400/05
摘要: 根据本发明实施例的处理音频信号的方法包括如下步骤:接收通过MPEG环绕212(MPS212)编码的音频比特流;基于接收到的音频比特流以及在格式转换器中定义的用于MPS212输出声道的渲染参数中的均衡(EQ)值和增益值,生成用于一个双声道单元(CPE)的内部声道信号;以及,基于所产生的内部声道信号生成立体声输出信号。
-
公开(公告)号:CN107395467A
公开(公告)日:2017-11-24
申请号:CN201710475818.2
申请日:2017-06-21
申请人: 北京小米移动软件有限公司
发明人: 曹丁鹏
CPC分类号: H04M1/72533 , G10L2015/223 , H04L12/2814 , H04M1/6016 , H04L12/2807 , G10L19/00 , H04L2012/284
摘要: 本公开是关于智能家居的初始化方法及装置。该方法包括:接收目标设备播放的初始化声音信号,其中,初始化声音信号为智能家居的初始化数据的源数据编码后得到的目标字符的声音信号;根据预先存储的预设字符与预设字符的源数据的对应关系,对初始化声音信号进行解码,以获得初始化数据的源数据,其中,预设字符至少包括目标字符;根据初始化数据的源数据对智能家居进行初始化。该技术方案,可以实现在不需要对智能设备和目标设备上的硬件、以及通信距离进行过多要求的基础上,可通过初始化声音信号提高初始化数据的输入效率,并自动完成对智能家居的初始化操作。
-
公开(公告)号:CN107293311A
公开(公告)日:2017-10-24
申请号:CN201710341997.0
申请日:2012-12-21
申请人: 华为技术有限公司
摘要: 为用于语音或音频信号的非常短的基音周期检测和编码提供了系统和方法实施例。该系统和方法包括使用时域和频域基音周期检测技术的组合在语音或音频信号中检测是否存在比常规最小基音周期限制更短的非常短的基音周期。基音周期检测技术包括使用时域中的基音相关系数和检测频域中的语音或音频信号中的低频能量的缺少。使用开始于预定义最小的非常短的基音限制(小于常规最小基音限制)的基音周期范围对检测到的非常短的基音周期进行编码。
-
公开(公告)号:CN107180644A
公开(公告)日:2017-09-19
申请号:CN201710165066.X
申请日:2017-03-10
申请人: GN瑞声达A/S
发明人: M·S·卡瓦莱卡拉姆 , M·G·克里斯坦森 , F·格兰 , J·B·博尔特
IPC分类号: G10L21/0208 , G10L21/0216 , G10L21/0264 , G10L19/00 , G10L19/07 , G10L19/26
CPC分类号: H04R25/505 , G10L21/0208 , G10L25/12 , H04R1/1083 , H04R25/552 , H04R2201/107 , H04R2225/43 , G10L19/00 , G10L19/07 , G10L19/26 , G10L21/0216 , G10L21/0264 , G10L2019/0001 , G10L2021/02165
摘要: 本申请涉及使用基于码本的方法的基于卡尔曼滤波的语音增强。本发明公开用于增强语音可懂度的方法和听力设备,听力设备包括用于提供包括语音信号和噪声信号的输入信号的输入变换器;配置为用于处理输入信号的处理单元;耦合到处理单元的输出用于将来自处理单元的输出信号转换成音频输出信号的声学输出变换器;其中处理单元配置为用于对输入信号执行基于码本的方法处理,其中处理单元配置为用于基于基于码本的方法处理确定输入信号的一个或多个参数,其中处理单元配置为用于使用所确定的一个或多个参数执行输入信号的卡尔曼滤波,其中处理单元配置为使得输出信号由于卡尔曼滤波而增强了语音可懂度。
-
-
-
-
-
-
-
-
-