车载多通道含噪语音仿真及增广方法、装置和电子设备

发明公开

CN118351823A 车载多通道含噪语音仿真及增广方法、装置和电子设备审中-实审

请登陆查看更多内容

专利标题： 车载多通道含噪语音仿真及增广方法、装置和电子设备
申请号： CN202410458161.9

申请日： 2024-04-16
公开(公告)号： CN118351823A

公开(公告)日： 2024-07-16
发明人: 邵雅婷 , 周强 , 刘威亚
申请人： 思必驰科技股份有限公司
申请人地址： 江苏省苏州市工业园区新平街388号腾飞科技园14幢
专利权人： 思必驰科技股份有限公司
当前专利权人： 思必驰科技股份有限公司
当前专利权人地址： 江苏省苏州市工业园区新平街388号腾飞科技园14幢
代理机构： 苏州创智高诺知识产权代理有限公司
代理商 戈余丽
主分类号： G10L13/02
IPC分类号： G10L13/02 ; G10L15/06

摘要：

本申请公开了一种车载多通道含噪语音仿真及增广方法、装置和电子设备，涉及语音识别技术领域。其中，仿真方法包括：基于声源x，获取传声器采集到的多通道信号y；通过解卷积计算得到所述声源x相对传声器的房间冲激响应rir；利用房间冲激响应rir卷积单通道人声信号，得到多通道人声信号；根据预设的信噪比，将所述多通道人声信号与实车噪声信号进行叠加，得到多通道含噪语音。本申请采用实车录制数据解卷积得到房间冲激响应，有效减少了车载音频制作中的实车录制工作量，增强了音频模型的鲁棒性。另外，采用移位的方式进行数据增广，进一步减少了实车录制房间冲激响应的工作量，增加了点位的丰富度，增强了音频模型的稳定性。

信息查询

中国专利公布公告 Global Dossier Espacenet

IPC分类:

G	物理
G10	乐器；声学
G10L	语音分析或合成；语音识别；语音或声音处理；语音或音频编码或解码
G10L13/00	语音合成；文本-语音合成系统
G10L13/02	.产生合成语音的方法；语音合成设备