-
公开(公告)号:CN118824283A
公开(公告)日:2024-10-22
申请号:CN202411307374.8
申请日:2024-09-19
Applicant: 苏州声学产业技术研究院有限公司
IPC: G10L25/30 , G06F18/2415 , G06F18/15 , G06F18/214 , G06N3/045 , G06N3/084 , G10L25/51
Abstract: 本发明公开了基于数据混合和标签平滑训练模型及环境声音分类的方法,涉及语音或声音处理技术领域;训练方法包括步骤S1:获得批数据;步骤S2:时域数据增强和时域预处理;步骤S3:混合音频和标签平滑;步骤S4:频域预处理和频域增强;步骤S5:更新深度学习模型参数;其通过混合音频和标签平滑等,训练深度学习模型效率更高;分类方法包括用训练好的深度学习模型对环境声音分类获得分类结果,分类结果精度更高。
-
公开(公告)号:CN118824283B
公开(公告)日:2025-01-28
申请号:CN202411307374.8
申请日:2024-09-19
Applicant: 苏州声学产业技术研究院有限公司
IPC: G10L25/30 , G06F18/2415 , G06F18/15 , G06F18/214 , G06N3/045 , G06N3/084 , G10L25/51
Abstract: 本发明公开了基于数据混合和标签平滑训练模型及环境声音分类的方法,涉及语音或声音处理技术领域;训练方法包括步骤S1:获得批数据;步骤S2:时域数据增强和时域预处理;步骤S3:混合音频和标签平滑;步骤S4:频域预处理和频域增强;步骤S5:更新深度学习模型参数;其通过混合音频和标签平滑等,训练深度学习模型效率更高;分类方法包括用训练好的深度学习模型对环境声音分类获得分类结果,分类结果精度更高。
-