-
公开(公告)号:CN112235691B
公开(公告)日:2022-09-16
申请号:CN202011096546.3
申请日:2020-10-14
Applicant: 南京南大电子智慧型服务机器人研究院有限公司 , 南京大学 , 江苏南大电子信息技术股份有限公司
IPC: H04R3/00 , G10L21/0216 , G10L21/0208
Abstract: 本发明公开了一种混合式的小空间声重放品质提升方法,将扬声器重放系统看成多通道系统,确定代价函数,最小化代价函数,并引入形状因数,转化到频域,得到最优化滤波器,根据目标响应矩阵A(z)可得到串扰消除系统和均衡系统,计算串扰消除效果矩阵、隔离度、谱偏差SD评价均衡性能优劣,本发明能够有效地优化整车音响系统的音质和空间感。
-
公开(公告)号:CN114974195A
公开(公告)日:2022-08-30
申请号:CN202111247252.0
申请日:2021-10-26
Applicant: 南京南大电子智慧型服务机器人研究院有限公司 , 南京大学 , 江苏南大电子信息技术股份有限公司
IPC: G10K11/178
Abstract: 本发明公开了一种跟踪抑制自适应反馈有源控制系统水床效应的方法,包括以下步骤:次级路径建模;使用误差传感器所拾取的误差信号e(n)减去馈给次级声源的控制信号y(n)经次级路径模型滤波后的信号合成参考信号x(n);通过次级路径模型和参考信号计算滤波‑x信号r(n);对初始噪声信号进行线性预测获得初始噪声的白化滤波器;将误差信号e(n)经过白化滤波器滤波得到滤波‑e信号e'(n);将滤波‑x信号r(n)经过白化滤波器滤波得到滤波‑r信号r'(n);对控制滤波器系数迭代,同时使得代价函数最小。本发明可实时踪并抑制由“水床”效应产生的噪声放大且无需预先知道“水床”出现的位置。
-
公开(公告)号:CN113707133B
公开(公告)日:2022-02-18
申请号:CN202111258859.9
申请日:2021-10-28
Applicant: 南京南大电子智慧型服务机器人研究院有限公司 , 南京大学 , 江苏南大电子信息技术股份有限公司
Abstract: 本发明公开了一种基于声环境感知的服务机器人语音输出增益获取方法,首先确定语言可懂度指标,然后测量单位幅度信号驱动时,机器人发声系统在目标位置处产生的语声级零敏度SS;获取服务机器人工作场所的混响时间T60;使用机器人自身的传声器获取所在场景的背景噪声级NL;根据语言可懂度指标、混响时间T60、语音背景噪声级NL代入语言可懂度预测模型得到目标位置的期望语声级SPL;根据语声级零敏度SS和期望语声级SPL实时得到语音输出增益。本发明在机器人所处复杂声环境中时可考虑反射声和背景噪声的影响,有效提升机器人发声时的语音可懂度,并降低对周边环境的影响。
-
公开(公告)号:CN113905323A
公开(公告)日:2022-01-07
申请号:CN202111261650.8
申请日:2021-10-28
Applicant: 南京南大电子智慧型服务机器人研究院有限公司 , 南京大学 , 江苏南大电子信息技术股份有限公司
Abstract: 本发明公开了一种适用于服务型机器人播放音频时的感知声源高度修正方法,包括以下步骤:服务型机器人本地设备存储了各种头相关传递函数HRTF构成头相关传递函数HRTF数据库,各种头相关传递函数HRTF涵盖了不同的高度听觉高度信息,服务型机器人根据多模传感交互方式获取人机交互主体听者的高度信息,根据生理高度特征对头相关传递函数HRTF进行匹配,然后对匹配的头相关传递函数HRTF进行微调,卷积本地音频数据,并输出给服务型机器人放音设备。本发明能够有效地实时修正服务型机器人的人机交互声音高度问题,解决了不同的服务型机器人和不同的听者在使用服务型机器人进行人机交互式时的虚拟声像的差异化问题。
-
公开(公告)号:CN113707136A
公开(公告)日:2021-11-26
申请号:CN202111258776.X
申请日:2021-10-28
Applicant: 南京南大电子智慧型服务机器人研究院有限公司 , 南京大学 , 江苏南大电子信息技术股份有限公司
Abstract: 本发明公开了一种服务型机器人语音交互的音视频混合语音前端处理方法,具体步骤如下:(1)通过视频处理手段捕获期望说话人嘴部动作信息;(2)根据期望说话人嘴部动作信息获得准确的语音激活检测结果;(3)根据语音活动检测结果,优化机器人传声器阵列的波束算法;(4)通过阵列传声器实现语音增强,抑制环境噪声,提升机器人采集语音的信噪比。本发明在机器人所处复杂声场环境中可以有效提升机器人采集语音的信号质量。
-
公开(公告)号:CN112017683B
公开(公告)日:2021-01-05
申请号:CN202011121947.X
申请日:2020-10-20
Applicant: 南京南大电子智慧型服务机器人研究院有限公司 , 江苏南大电子信息技术股份有限公司
IPC: G10L21/0208 , G10L21/0232
Abstract: 本发明公开了一种频域无次级路径有源噪声控制系统,包括相位调节器、相位调节参数更新模块,其中,相位调节器用于调整参考信号的频域信号的相位,相位调节参数更新模块用于动态更新相位调节器中的相位参数;所述相位调节器每隔2M帧参考信号在第k个频点给出一个相位扰动量,相位调节器的相位参数在工作过程中通过相位调节参数更新模块实时的更新,更新的结果用于更新控制滤波器。本发明使用相位调节器更新模块在线更新相位调节器,调整控制滤波器的收敛方向,进而达到最优的系统收敛性能和噪声控制效果。
-
公开(公告)号:CN109616131A
公开(公告)日:2019-04-12
申请号:CN201811342131.2
申请日:2018-11-12
Applicant: 南京南大电子智慧型服务机器人研究院有限公司 , 南京大学 , 江苏南大电子信息技术股份有限公司
IPC: G10L21/007
Abstract: 本发明公开了一种数字实时语音变音方法,通过对原始语音的非清音部分进行调整和分析,并根据比较结果,提取特定人基音库中的信号替代原始基音,进一步通过合成和叠加处理获得变音信号。本发明变音效果具有自然度和可懂度高的特点,变音后的语音不容易被复原,具有较强的保密性,同时本发明兼具低时延和低复杂度的特点。
-
公开(公告)号:CN110579275B
公开(公告)日:2022-03-11
申请号:CN201910998284.0
申请日:2019-10-21
Applicant: 南京南大电子智慧型服务机器人研究院有限公司 , 南京大学
Abstract: 本发明公开了一种基于球形矢量传声器阵列实现声场分离的方法,包括(1)获得波长λ和波数k;(2)确定球形矢量传声器阵列的半径R,得到可分离出的声场的截断阶数NR;(3)布置(NR+1)2个矢量传声器;(4)构建系数矩阵G;(5)求得外向、内向声场的各阶系数O和I;(6)获得外向辐射声场;(7)获得内向辐射声场。本发明公布的声场分离方法,在用单层球面上布放较少的矢量传声器就可以在混响环境中实现声场分离。
-
公开(公告)号:CN110726972A
公开(公告)日:2020-01-24
申请号:CN201910998291.0
申请日:2019-10-21
Applicant: 南京南大电子智慧型服务机器人研究院有限公司 , 南京大学
IPC: G01S5/20
Abstract: 本发明公开了一种干扰及高混响环境下使用传声器阵列的语音声源定位方法,步骤如下:(1)设定参数;(2)短时傅里叶变换,得到时-频域信号;(3)对时-频域信号的每个时-频点,计算对数化的交叉谱幅度均值,获得“能量”包络;(4)对时-频域信号的每个时-频点,计算“能量”包络的“变化率”;(5)利用瞬态噪声特征,判断并定位瞬态噪声;(6)选择直达声对应的时-频点,并忽略瞬态噪声部分;(7)对选中的时-频点,应用加权SRP-PHAT方法,得到定位结果。本发明中语音声源定位方法,能够使得在高混响及干扰的环境中,依然可以获得精确度和鲁棒性较高的结果。
-
公开(公告)号:CN110726972B
公开(公告)日:2022-09-16
申请号:CN201910998291.0
申请日:2019-10-21
Applicant: 南京南大电子智慧型服务机器人研究院有限公司 , 南京大学
IPC: G01S5/20
Abstract: 本发明公开了一种干扰及高混响环境下使用传声器阵列的语音声源定位方法,步骤如下:(1)设定参数;(2)短时傅里叶变换,得到时‑频域信号;(3)对时‑频域信号的每个时‑频点,计算对数化的交叉谱幅度均值,获得“能量”包络;(4)对时‑频域信号的每个时‑频点,计算“能量”包络的“变化率”;(5)利用瞬态噪声特征,判断并定位瞬态噪声;(6)选择直达声对应的时‑频点,并忽略瞬态噪声部分;(7)对选中的时‑频点,应用加权SRP‑PHAT方法,得到定位结果。本发明中语音声源定位方法,能够使得在高混响及干扰的环境中,依然可以获得精确度和鲁棒性较高的结果。
-
-
-
-
-
-
-
-
-