-
公开(公告)号:CN117351995B
公开(公告)日:2025-04-15
申请号:CN202311247442.1
申请日:2023-09-25
Applicant: 珠海高凌信息科技股份有限公司
Abstract: 本发明提出了一种基于深度学习复合模型的环境声音识别方法及装置,该方法包括:获取环境音频,对环境音频进行特征提取得到环境音频特征,将环境音频特征输入预先训练好的复合模型,复合模型包括多个网络结构不同的通用模型;通过通用模型识别出各个类别标签对应的通用识别置信度;基于通用模型的模型权值和通用识别置信度,确定各个类别标签的目标加权置信度作为通用模型的分类输出结果;根据目标加权置信度的均值得到复合模型的输出结果。根据本发明实施例的技术方案,能够通过多个不同网络结构的通用模型对环境音频识别的置信度进行加权融合,能够降低分类识别的过拟合风险,增强泛化能力,能够在长期使用场景下维持对环境音频识别的准确性。
-
公开(公告)号:CN117352001A
公开(公告)日:2024-01-05
申请号:CN202311265881.5
申请日:2023-09-27
Applicant: 珠海高凌信息科技股份有限公司
Abstract: 本申请公开了一种环境噪声检测方法、装置、电子设备、存储介质,方法包括获取包括多个音频帧的待识别音频数据,将全部的音频帧按照采集音频帧的时间先后顺序放入音频切片队列;从全部的音频帧中确定参考音频帧,根据参考音频帧的参考时刻和预设滑动步长对音频切片队列中的音频帧进行切片,得到目标音频数据;将目标音频数据输入至声音识别模型,得到初始噪声识别结果;根据当前的气象信息和初始噪声识别结果确定目标噪声识别结果。本申请通过声音识别模型结合实时的气象信息得到最终的目标噪声识别结果,实现人工智能与多场景化综合识别环境噪声,相比仅采用声音识别模型识别环境噪声的方案,能够有效提升环境噪声的准确辨识率。
-
公开(公告)号:CN117541735A
公开(公告)日:2024-02-09
申请号:CN202311386933.4
申请日:2023-10-24
Applicant: 珠海高凌信息科技股份有限公司
Abstract: 本发明提供一种基于倾斜摄影模型构建动态三维噪声地图的方法,包括完成倾斜摄影和像控点测量数据采集;将获取到的原始影像数据进行图像处理,获得最佳成像效果的倾斜摄影数据;基于倾斜摄影数据形成完整的CIM城市信息三维模型,根据修正后的源清单信息构建噪声地图计算模型,将数据代入噪声地图计算模型进行动态计算,结合声源噪声拟合算法和噪声传播衰减算法,计算生成基础三维噪声地图,并利用监测数据进行修正,根据瞬时、小时、昼夜等频生成动态噪声地图数据,并结合噪声地图原始数据在cesium三维渲染引擎上进行地图数据更新。本发明以三维地图为基础,融合CIM实景三维模型、城市实时动态噪声地图模型,实现实时动态的噪声地图一屏统览。
-
公开(公告)号:CN117351995A
公开(公告)日:2024-01-05
申请号:CN202311247442.1
申请日:2023-09-25
Applicant: 珠海高凌信息科技股份有限公司
Abstract: 本发明提出了一种基于深度学习复合模型的环境声音识别方法及装置,该方法包括:获取环境音频,对环境音频进行特征提取得到环境音频特征,将环境音频特征输入预先训练好的复合模型,复合模型包括多个网络结构不同的通用模型;通过通用模型识别出各个类别标签对应的通用识别置信度;基于通用模型的模型权值和通用识别置信度,确定各个类别标签的目标加权置信度作为通用模型的分类输出结果;根据目标加权置信度的均值得到复合模型的输出结果。根据本发明实施例的技术方案,能够通过多个不同网络结构的通用模型对环境音频识别的置信度进行加权融合,能够降低分类识别的过拟合风险,增强泛化能力,能够在长期使用场景下维持对环境音频识别的准确性。
-
-
-