-
公开(公告)号:CN110931027B
公开(公告)日:2024-09-27
申请号:CN201811090353.X
申请日:2018-09-18
Applicant: 北京三星通信技术研究有限公司 , 三星电子株式会社
IPC: G10L21/02 , G10L21/0208 , G10L21/0216
Abstract: 本申请实施例提供了一种音频处理的方法、装置、电子设备及计算机可读存储介质,涉及语音增强技术领域,该方法包括:获取空气传导音频采集设备采集的第一音频信号以及体传导音频采集设备采集到的第二音频信号,然后基于第一音频信号以及第二音频信号之间的信号相关性,对第一音频信号以及第二音频信号进行语音增强处理,得到语音增强处理后待输出的音频信号。本申请实施例实现了对耳机的音频采集设备采集到的信号进行音频增强,可以得到效果更好的音频信号,以进行语音传输或者语音识别等应用。
-
公开(公告)号:CN113284504A
公开(公告)日:2021-08-20
申请号:CN202010725583.X
申请日:2020-07-24
Applicant: 北京三星通信技术研究有限公司 , 三星电子株式会社
IPC: G10L21/0208 , G10L21/0216 , G10L21/0232 , G10L19/02 , G10L25/30 , H04M1/72454
Abstract: 本申请提供了一种姿态检测方法、装置、电子设备及计算机可读存储介质,其中方法包括:通过至少两个语音采集设备采集语音通话过程中的语音信号;获取语音信号对应的姿态能量信息;根据姿态能量信息,从各预定姿态中确定出用户在语音通话过程中的姿态,其中,在获取姿态能量信息的步骤中可以采用人工智能模块进行相关处理。通过预先设定多种预定姿态,再根据语音通话过程中多个语音采集设备采集到的语音信号的姿态能量信息,从预先设定的多种预定姿态中确定出用户在通话过程中的姿态,即得到了用户姿态检测结果,可以为通话语音质量增强提供参考,优化噪声抑制处理的效果。
-
公开(公告)号:CN110931027A
公开(公告)日:2020-03-27
申请号:CN201811090353.X
申请日:2018-09-18
Applicant: 北京三星通信技术研究有限公司 , 三星电子株式会社
IPC: G10L21/02 , G10L21/0208 , G10L21/0216
Abstract: 本申请实施例提供了一种音频处理的方法、装置、电子设备及计算机可读存储介质,涉及语音增强技术领域,该方法包括:获取空气传导音频采集设备采集的第一音频信号以及体传导音频采集设备采集到的第二音频信号,然后基于第一音频信号以及第二音频信号之间的信号相关性,对第一音频信号以及第二音频信号进行语音增强处理,得到语音增强处理后待输出的音频信号。本申请实施例实现了对耳机的音频采集设备采集到的信号进行音频增强,可以得到效果更好的音频信号,以进行语音传输或者语音识别等应用。
-
公开(公告)号:CN108346432A
公开(公告)日:2018-07-31
申请号:CN201710056192.1
申请日:2017-01-25
Applicant: 北京三星通信技术研究有限公司 , 三星电子株式会社
IPC: G10L19/008 , G10L21/028 , G10L25/84
Abstract: 本发明提供了一种虚拟现实VR音频处理的方法及相应设备,包括VR音频的发送端获取高保真立体声Ambisonics信号旋转角度,其中,Ambisonics信号旋转角度是根据VR音频的接收端对应的第一设备旋转角度确定出的,然后根据获取的Ambisonics信号旋转角度,对Ambisonics信号进行旋转,和/或,VR音频的发送端获取根据VR音频的相关信息确定的混合阶高保真立体声MOA信号的阶数,然后依据MOA信号的阶数,从高保真立体声Ambisonics信号中提取出MOA信号。本发明实施例适用于根据设备的旋转角度确定Ambisonics信号旋转角度,进行旋转,并提取出MOA信号。
-
公开(公告)号:CN107479810A
公开(公告)日:2017-12-15
申请号:CN201610399484.0
申请日:2016-06-07
Applicant: 北京三星通信技术研究有限公司 , 三星电子株式会社
IPC: G06F3/0488
CPC classification number: G06F3/04886
Abstract: 本发明实施例提供了基于辅助显示区域的操作方法及终端设备,所述方法包括:检测到针对对象的触发操作,在辅助显示区域中显示对象的相关内容;基于针对所述辅助显示区域中的对象的相关内容的操作,对所述对象的相关内容进行相应处理。本发明实施例中,基于针对辅助显示区域显示的对象的相关内容进行的操作,可以对该对象的深层次内容和/或隐藏内容进行深入处理,大大增强了辅助显示区域与应用涉及的对象之间的交互深度,扩展了辅助显示区域的功能,提升了利用辅助显示区域的水平,有助于满足用户对深层次交互的需要,简化深层次交互的复杂度,从而提升用户的体验。
-
公开(公告)号:CN104869523A
公开(公告)日:2015-08-26
申请号:CN201410067398.0
申请日:2014-02-26
Applicant: 北京三星通信技术研究有限公司 , 三星电子株式会社
Inventor: 杨磊
Abstract: 本发明提供了一种虚拟多声道播放音频文件的方法、终端及系统,其中,方法包括:终端A获取终端组中各个终端的位置分布图和用户收听位置;利用位置分布图和用户收听位置,终端A计算虚拟多声道播放时各个终端的音频信号参数;终端A指示终端组中的各个终端根据各自的音频信号参数播放所述音频文件。在本发明提供的实施例中,利用位置分布图和用户收听位置,终端A计算出虚拟多声道播放时各个终端的音频信号参数,终端组中的各个终端根据各自的音频信号参数播放音频文件,从而实现根据终端组中各个终端的位置分布图和用户收听位置调整音频信号参数,获取虚拟多声道播放音频文件的效果,提高了用户收听音频文件的临场感,同时也避免购置昂贵的多声道播放音箱。
-
公开(公告)号:CN110767244A
公开(公告)日:2020-02-07
申请号:CN201810827229.0
申请日:2018-07-25
Applicant: 中国科学技术大学 , 北京三星通信技术研究有限公司
IPC: G10L21/02 , G10L21/0208 , G10L25/30
Abstract: 本发明公开了一种语音增强方法,包括:提取各语音帧的声学特征;利用干净语音的与噪声语音的样本对渐进式双输出神经网络模型进行训练,利用训练后的渐进式双输出神经网络模型估计各语音帧的理想软掩蔽,并进行声学特征的增强处理;如果应用到人耳,则利用增强后的声学特征对波形进行重构,得到可主观测听的波形;如果应用到语音识别系统,则将估计到的理想软掩蔽应用到输入语音的声学特征上上,得到掩蔽后的声学特征,然后对波形进行重构得到增强后的语音。本发明上述方案可以满足人耳降噪需求和提升带噪语音的识别准确率。
-
公开(公告)号:CN107968984A
公开(公告)日:2018-04-27
申请号:CN201610916256.6
申请日:2016-10-20
Applicant: 中国科学院声学研究所 , 北京三星通信技术研究有限公司
Abstract: 本发明公开了一种5-2通道音频转换优化方法,所述方法包括:步骤1)将五通道音频下降混合到两通道;步骤2)在频域上将五通道音频以及两通道音频的声场进行归一化映射,得到两者声场的方向向量表示;步骤3)利用归一化之后两个方向向量的差值对两通道音频的幅度和相角进行校正;步骤4)将校正之后的双通道信号的幅度和相角重新组合形成每个频带内的复数值,然后再转换成时域信号,得到处理后两通道音频。通过本发明的方法得到的双声道的声场更接近五通道声场,从而保持原有的良好空间听觉感受。
-
公开(公告)号:CN107968984B
公开(公告)日:2019-08-20
申请号:CN201610916256.6
申请日:2016-10-20
Applicant: 中国科学院声学研究所 , 北京三星通信技术研究有限公司
Abstract: 本发明公开了一种5‑2通道音频转换优化方法,所述方法包括:步骤1)将五通道音频下降混合到两通道;步骤2)在频域上将五通道音频以及两通道音频的声场进行归一化映射,得到两者声场的方向向量表示;步骤3)利用归一化之后两个方向向量的差值对两通道音频的幅度和相角进行校正;步骤4)将校正之后的双通道信号的幅度和相角重新组合形成每个频带内的复数值,然后再转换成时域信号,得到处理后两通道音频。通过本发明的方法得到的双声道的声场更接近五通道声场,从而保持原有的良好空间听觉感受。
-
公开(公告)号:CN110767244B
公开(公告)日:2024-03-29
申请号:CN201810827229.0
申请日:2018-07-25
Applicant: 中国科学技术大学 , 北京三星通信技术研究有限公司
IPC: G10L21/02 , G10L21/0208 , G10L25/30
Abstract: 本发明公开了一种语音增强方法,包括:提取各语音帧的声学特征;利用干净语音的与噪声语音的样本对渐进式双输出神经网络模型进行训练,利用训练后的渐进式双输出神经网络模型估计各语音帧的理想软掩蔽,并进行声学特征的增强处理;如果应用到人耳,则利用增强后的声学特征对波形进行重构,得到可主观测听的波形;如果应用到语音识别系统,则将估计到的理想软掩蔽应用到输入语音的声学特征上上,得到掩蔽后的声学特征,然后对波形进行重构得到增强后的语音。本发明上述方案可以满足人耳降噪需求和提升带噪语音的识别准确率。
-
-
-
-
-
-
-
-
-