-
公开(公告)号:CN105451152A
公开(公告)日:2016-03-30
申请号:CN201510736336.9
申请日:2015-11-02
Applicant: 上海交通大学
CPC classification number: H04S7/30 , H04S3/004 , H04S7/303 , H04S2400/11 , H04S2420/05
Abstract: 本发明公开了一种基于听者位置跟踪的实时声场重建系统和方法,其特征在于,采用了摄像头来采集听者的位置,并通过计算机来计算出听者的位置坐标,采用时间反演法计算得到对应通道的脉冲响应,再通过离散傅里叶变化以及离散傅里叶反变化得到音频滤波器的滤波系数,原声源音频流通过与该滤波系数进行卷积,经过多通道声卡传输给对应扬声器阵列输出声音。在听者移动时,重复以上步骤,实现声场的实时更新,确保声场输出的虚拟声源位于听者身边,给听者带来更好的视听效果。
-
公开(公告)号:CN103325375A
公开(公告)日:2013-09-25
申请号:CN201310224360.5
申请日:2013-06-05
Applicant: 上海交通大学
IPC: G10L19/06
Abstract: 本发明提供一种改进的基于线性预测参数编码基本原理的极低码率语音编解码设备及编解码方法,充分利用参数的帧内、帧间以及各参数之间的相关性,应用矢量量化技术对编码器的各项参数进行压缩;并在压缩的同时充分利用人耳的听觉感知特性,对各项参数采用不同的加权失真度量进行量化或反量化,从而在不影响人耳听觉质量的前提下对数据进行更高效地压缩。本发明以尽可能低的算法复杂度,在保证语音质量的前提下,实现了能工作在600bps和300bps两种码率的极低码率语音编解码。
-
公开(公告)号:CN105590021B
公开(公告)日:2018-06-12
申请号:CN201510750553.3
申请日:2015-11-06
Applicant: 上海交通大学
Abstract: 本发明涉及一种基于麦克风阵列的多声源跟踪方法,所述方法包括:利用波束形成算法处理麦克风阵列接收信号并计算空间谱;计算空间谱峰与跟踪声源的匹配概率以实现两者的数据关联;根据匹配结果更新各个跟踪声源的粒子权值并更新声源位置;检测谱峰判定为新声源的概率,激活新声源粒子滤波器并评估其存在可能性;监测跟踪声源活跃状态并删除非活跃声源。采用本发明可以实现动态声源数量的多目标实时跟踪,在人机交互、远程会议及虚拟现实等复杂场景中都有广泛的应用。
-
公开(公告)号:CN105590021A
公开(公告)日:2016-05-18
申请号:CN201510750553.3
申请日:2015-11-06
Applicant: 上海交通大学
Abstract: 本发明涉及一种基于麦克风阵列的多声源跟踪方法,所述方法包括:利用波束形成算法处理麦克风阵列接收信号并计算空间谱;计算空间谱峰与跟踪声源的匹配概率以实现两者的数据关联;根据匹配结果更新各个跟踪声源的粒子权值并更新声源位置;检测谱峰判定为新声源的概率,激活新声源粒子滤波器并评估其存在可能性;监测跟踪声源活跃状态并删除非活跃声源。采用本发明可以实现动态声源数量的多目标实时跟踪,在人机交互、远程会议及虚拟现实等复杂场景中都有广泛的应用。
-
公开(公告)号:CN103325375B
公开(公告)日:2016-05-04
申请号:CN201310224360.5
申请日:2013-06-05
Applicant: 上海交通大学
IPC: G10L19/06
Abstract: 本发明提供一种改进的基于线性预测参数编码基本原理的极低码率语音编解码设备及编解码方法,充分利用参数的帧内、帧间以及各参数之间的相关性,应用矢量量化技术对编码器的各项参数进行压缩;并在压缩的同时充分利用人耳的听觉感知特性,对各项参数采用不同的加权失真度量进行量化或反量化,从而在不影响人耳听觉质量的前提下对数据进行更高效地压缩。本发明以尽可能低的算法复杂度,在保证语音质量的前提下,实现了能工作在600bps和300bps两种码率的极低码率语音编解码。
-
-
-
-