发明公开
- 专利标题: 车载多通道含噪语音仿真及增广方法、装置和电子设备
-
申请号: CN202410458161.9申请日: 2024-04-16
-
公开(公告)号: CN118351823A公开(公告)日: 2024-07-16
- 发明人: 邵雅婷 , 周强 , 刘威亚
- 申请人: 思必驰科技股份有限公司
- 申请人地址: 江苏省苏州市工业园区新平街388号腾飞科技园14幢
- 专利权人: 思必驰科技股份有限公司
- 当前专利权人: 思必驰科技股份有限公司
- 当前专利权人地址: 江苏省苏州市工业园区新平街388号腾飞科技园14幢
- 代理机构: 苏州创智高诺知识产权代理有限公司
- 代理商 戈余丽
- 主分类号: G10L13/02
- IPC分类号: G10L13/02 ; G10L15/06
摘要:
本申请公开了一种车载多通道含噪语音仿真及增广方法、装置和电子设备,涉及语音识别技术领域。其中,仿真方法包括:基于声源x,获取传声器采集到的多通道信号y;通过解卷积计算得到所述声源x相对传声器的房间冲激响应rir;利用房间冲激响应rir卷积单通道人声信号,得到多通道人声信号;根据预设的信噪比,将所述多通道人声信号与实车噪声信号进行叠加,得到多通道含噪语音。本申请采用实车录制数据解卷积得到房间冲激响应,有效减少了车载音频制作中的实车录制工作量,增强了音频模型的鲁棒性。另外,采用移位的方式进行数据增广,进一步减少了实车录制房间冲激响应的工作量,增加了点位的丰富度,增强了音频模型的稳定性。