虚拟现实VR音频的处理方法及相应设备

    公开(公告)号:CN108346432A

    公开(公告)日:2018-07-31

    申请号:CN201710056192.1

    申请日:2017-01-25

    Abstract: 本发明提供了一种虚拟现实VR音频处理的方法及相应设备,包括VR音频的发送端获取高保真立体声Ambisonics信号旋转角度,其中,Ambisonics信号旋转角度是根据VR音频的接收端对应的第一设备旋转角度确定出的,然后根据获取的Ambisonics信号旋转角度,对Ambisonics信号进行旋转,和/或,VR音频的发送端获取根据VR音频的相关信息确定的混合阶高保真立体声MOA信号的阶数,然后依据MOA信号的阶数,从高保真立体声Ambisonics信号中提取出MOA信号。本发明实施例适用于根据设备的旋转角度确定Ambisonics信号旋转角度,进行旋转,并提取出MOA信号。

    基于辅助显示区域的操作方法及终端设备

    公开(公告)号:CN107479810A

    公开(公告)日:2017-12-15

    申请号:CN201610399484.0

    申请日:2016-06-07

    CPC classification number: G06F3/04886

    Abstract: 本发明实施例提供了基于辅助显示区域的操作方法及终端设备,所述方法包括:检测到针对对象的触发操作,在辅助显示区域中显示对象的相关内容;基于针对所述辅助显示区域中的对象的相关内容的操作,对所述对象的相关内容进行相应处理。本发明实施例中,基于针对辅助显示区域显示的对象的相关内容进行的操作,可以对该对象的深层次内容和/或隐藏内容进行深入处理,大大增强了辅助显示区域与应用涉及的对象之间的交互深度,扩展了辅助显示区域的功能,提升了利用辅助显示区域的水平,有助于满足用户对深层次交互的需要,简化深层次交互的复杂度,从而提升用户的体验。

    虚拟多声道播放音频文件的方法、终端及系统

    公开(公告)号:CN104869523A

    公开(公告)日:2015-08-26

    申请号:CN201410067398.0

    申请日:2014-02-26

    Inventor: 杨磊

    Abstract: 本发明提供了一种虚拟多声道播放音频文件的方法、终端及系统,其中,方法包括:终端A获取终端组中各个终端的位置分布图和用户收听位置;利用位置分布图和用户收听位置,终端A计算虚拟多声道播放时各个终端的音频信号参数;终端A指示终端组中的各个终端根据各自的音频信号参数播放所述音频文件。在本发明提供的实施例中,利用位置分布图和用户收听位置,终端A计算出虚拟多声道播放时各个终端的音频信号参数,终端组中的各个终端根据各自的音频信号参数播放音频文件,从而实现根据终端组中各个终端的位置分布图和用户收听位置调整音频信号参数,获取虚拟多声道播放音频文件的效果,提高了用户收听音频文件的临场感,同时也避免购置昂贵的多声道播放音箱。

    语音增强方法
    27.
    发明公开

    公开(公告)号:CN110767244A

    公开(公告)日:2020-02-07

    申请号:CN201810827229.0

    申请日:2018-07-25

    Abstract: 本发明公开了一种语音增强方法,包括:提取各语音帧的声学特征;利用干净语音的与噪声语音的样本对渐进式双输出神经网络模型进行训练,利用训练后的渐进式双输出神经网络模型估计各语音帧的理想软掩蔽,并进行声学特征的增强处理;如果应用到人耳,则利用增强后的声学特征对波形进行重构,得到可主观测听的波形;如果应用到语音识别系统,则将估计到的理想软掩蔽应用到输入语音的声学特征上上,得到掩蔽后的声学特征,然后对波形进行重构得到增强后的语音。本发明上述方案可以满足人耳降噪需求和提升带噪语音的识别准确率。

    一种5-2通道音频转换优化方法

    公开(公告)号:CN107968984A

    公开(公告)日:2018-04-27

    申请号:CN201610916256.6

    申请日:2016-10-20

    Abstract: 本发明公开了一种5-2通道音频转换优化方法,所述方法包括:步骤1)将五通道音频下降混合到两通道;步骤2)在频域上将五通道音频以及两通道音频的声场进行归一化映射,得到两者声场的方向向量表示;步骤3)利用归一化之后两个方向向量的差值对两通道音频的幅度和相角进行校正;步骤4)将校正之后的双通道信号的幅度和相角重新组合形成每个频带内的复数值,然后再转换成时域信号,得到处理后两通道音频。通过本发明的方法得到的双声道的声场更接近五通道声场,从而保持原有的良好空间听觉感受。

    一种5-2通道音频转换优化方法

    公开(公告)号:CN107968984B

    公开(公告)日:2019-08-20

    申请号:CN201610916256.6

    申请日:2016-10-20

    Abstract: 本发明公开了一种5‑2通道音频转换优化方法,所述方法包括:步骤1)将五通道音频下降混合到两通道;步骤2)在频域上将五通道音频以及两通道音频的声场进行归一化映射,得到两者声场的方向向量表示;步骤3)利用归一化之后两个方向向量的差值对两通道音频的幅度和相角进行校正;步骤4)将校正之后的双通道信号的幅度和相角重新组合形成每个频带内的复数值,然后再转换成时域信号,得到处理后两通道音频。通过本发明的方法得到的双声道的声场更接近五通道声场,从而保持原有的良好空间听觉感受。

    语音增强方法
    30.
    发明授权

    公开(公告)号:CN110767244B

    公开(公告)日:2024-03-29

    申请号:CN201810827229.0

    申请日:2018-07-25

    Abstract: 本发明公开了一种语音增强方法,包括:提取各语音帧的声学特征;利用干净语音的与噪声语音的样本对渐进式双输出神经网络模型进行训练,利用训练后的渐进式双输出神经网络模型估计各语音帧的理想软掩蔽,并进行声学特征的增强处理;如果应用到人耳,则利用增强后的声学特征对波形进行重构,得到可主观测听的波形;如果应用到语音识别系统,则将估计到的理想软掩蔽应用到输入语音的声学特征上上,得到掩蔽后的声学特征,然后对波形进行重构得到增强后的语音。本发明上述方案可以满足人耳降噪需求和提升带噪语音的识别准确率。

Patent Agency Ranking