-
公开(公告)号:CN118053409A
公开(公告)日:2024-05-17
申请号:CN202410190193.5
申请日:2024-02-21
Applicant: 南京龙垣信息科技有限公司
Abstract: 本发明涉及背景音效生成技术领域,具体涉及一种背景音效作品生成系统及方法;包括背景音效特征提取模组和背景音效生成模组,背景音效生成模组包括音乐特征采集模块、神经网络生成模块、后处理模块和声码器,神经网络生成模块与音乐特征采集模块连接,所诉神经网络生成模块与音乐特征采集模块连接,后处理模块分别与神经网络生成模块和声码器连接;生成方法为:建立所述背景音效特征提取系统;对所有背景音效数据进行预处理,将背景音效数据成为统一的特征输入;提取背景音效特征;对背景音效特征进行处理,生成背景音效;输出背景音效的语音波形,通过上述方式,实现了能够自动生成高质量的背景音效作品。
-
公开(公告)号:CN117854517A
公开(公告)日:2024-04-09
申请号:CN202410160194.5
申请日:2024-02-05
Applicant: 南京龙垣信息科技有限公司
Abstract: 本发明涉及车载智能语音技术领域,具体涉及一种车载多人实时智能语音交互系统;包括声音采集模块、多通道语音增强模块、语音识别模块、自然语音处理模块和语音合成模块,使用车载语音时,通过声音采集模块对声源进行采集,多通道语音增强模块将采集的声源进行多通道自注意力语音增强,随后语音识别模块通过时频域的多通道对齐与语音活动检测后的音频进行说话人聚类,利用自然语音处理模块进行实时语音识别将说话人音频进行语音转文字,最后语音合成模块将转换后的实时转换文字按目标说话人声源进行人机交互处理,实现了能够提高语音的识别率,减少噪声干扰,更准确的远距离语音识别,提升了用户的体验。
-