-
公开(公告)号:CN118191735A
公开(公告)日:2024-06-14
申请号:CN202410299663.1
申请日:2024-03-15
Applicant: 桂林电子科技大学
IPC: G01S5/20
Abstract: 本发明公开了基于球谐域空间谱分析的多声源检测与定位方法,具体是在球谐域下使用神经网络的时间序列建模能力,去除噪声影响,从而获取目标信号,并以此作为源数检测和空间谱估计的输入,采用最小方差无失真响应的方法扫描空间谱,利用所提出的最大声源数理论值约束的特征值的二阶统计量,提高源数检测准确率,同时结合迭代声源数定位的方法,实现连续定位(跟踪)多目标声源。本发明方法不仅可以解决室内场景下由噪声引起定位精度下降的问题,也可以解决由混响所引起的邻近伪峰的问题,提高多声源定位精度,同时可获取到较高的源数检测准确率。
-
公开(公告)号:CN118200840A
公开(公告)日:2024-06-14
申请号:CN202410299726.3
申请日:2024-03-15
Applicant: 桂林电子科技大学
IPC: H04S7/00
Abstract: 本发明针对空间音频提出了一种三维空间声混合式重放方法,将矢量基振幅平移技术和Ambisonic解码技术配合使用的混合式声重放技术。具体是将空间声场分为两个部分进行重放,第一部分是对点声源使用VBAP技术进行重放,然后对环境声场使用Ambisonic解码技术进行重放,然后将俩部分重放得到的信号合成为扬声器信号;此时面向扬声器设备可以直接重放。第二部分是当面向耳机设备重放时,则需要进行耳机渲染(虚拟扬声器法),将扬声器信号转变为双耳信号进行重放。本发明可以应对多种类型的空间声,重放后提高了原始音频的整体空间感(体现在声源的距离、方向),不仅适用于剧场、智能汽车等场景下的扬声器重放,也适用于应用在VR/AR等场景下的耳机重放。
-
公开(公告)号:CN112151047B
公开(公告)日:2022-08-05
申请号:CN202011030786.3
申请日:2020-09-27
Applicant: 桂林电子科技大学
IPC: G10L19/083 , G10L21/02 , G10L21/0208
Abstract: 本发明公开了一种应用于语音数字信号的实时自动增益控制方法,该方法包括:使用平滑滤波器求语音数字信号的近似上包络;将包络作为NLMS自适应滤波器的输入,NLMS的目标参考值根据输入信号为语音或非语音分别设置,将NLMS的自适应权重作为快速增益输出;若输入信号长时间非语音且时间超过预设的阀值,系统将切换为静默模式,快速增益设为1;若快速增益超过预设的最大增益值,则将快速增益设置为最大增益值;通过平滑滤波器将快速增益处理成平滑增益;使用平滑增益乘以输出语音信号得到输出语音信号。该方法具有快速、有效、实时的特点,可应用在实时语音通话,网络视频会议等场景,能有效解决语音忽大忽小的问题,改善用户的使用体验。
-
公开(公告)号:CN118135235A
公开(公告)日:2024-06-04
申请号:CN202410299683.9
申请日:2024-03-15
Applicant: 桂林电子科技大学
IPC: G06V10/40 , G06V10/82 , G06N3/0455
Abstract: 本发明公开了基于图像编码器的头相关传递函数(HRTF)个性化方法,以耳朵图像代替耳廓参数作为输入的一部分,用图像编码器对耳部图像进行编码和表征学习,另一方面,通过分析人体生理参数对个性化HRTF的影响,选取最优参数作为个性化模型输入的另一部分,将这两部分输入与HRTF建立非线性映射关系模型,将该模型生成的HRTF与实际测量的HRTF在幅度部分和相位部分分别作损失值计算,将计算的损失值反馈给模型并通过微调得到鲁棒的个性化HRTF预测模型。该方法生成的个性化HRTF能够直接与Ambisonic信号卷积,形成面向用户的个性化空间音频,能够满足广大用户对个性化HRTF的现实需求,在个性化空间音频与交互式虚拟声学场景中具有重要的应用价值。
-
公开(公告)号:CN112151047A
公开(公告)日:2020-12-29
申请号:CN202011030786.3
申请日:2020-09-27
Applicant: 桂林电子科技大学
IPC: G10L19/083 , G10L21/02 , G10L21/0208
Abstract: 本发明公开了一种应用于语音数字信号的实时自动增益控制方法,该方法包括:使用平滑滤波器求语音数字信号的近似上包络;将包络作为NLMS自适应滤波器的输入,NLMS的目标参考值根据输入信号为语音或非语音分别设置,将NLMS的自适应权重作为快速增益输出;若输入信号长时间非语音且时间超过预设的阀值,系统将切换为静默模式,快速增益设为1;若快速增益超过预设的最大增益值,则将快速增益设置为最大增益值;通过平滑滤波器将快速增益处理成平滑增益;使用平滑增益乘以输出语音信号得到输出语音信号。该方法具有快速、有效、实时的特点,可应用在实时语音通话,网络视频会议等场景,能有效解决语音忽大忽小的问题,改善用户的使用体验。
-
-
-
-