-
公开(公告)号:CN117351995B
公开(公告)日:2025-04-15
申请号:CN202311247442.1
申请日:2023-09-25
Applicant: 珠海高凌信息科技股份有限公司
Abstract: 本发明提出了一种基于深度学习复合模型的环境声音识别方法及装置,该方法包括:获取环境音频,对环境音频进行特征提取得到环境音频特征,将环境音频特征输入预先训练好的复合模型,复合模型包括多个网络结构不同的通用模型;通过通用模型识别出各个类别标签对应的通用识别置信度;基于通用模型的模型权值和通用识别置信度,确定各个类别标签的目标加权置信度作为通用模型的分类输出结果;根据目标加权置信度的均值得到复合模型的输出结果。根据本发明实施例的技术方案,能够通过多个不同网络结构的通用模型对环境音频识别的置信度进行加权融合,能够降低分类识别的过拟合风险,增强泛化能力,能够在长期使用场景下维持对环境音频识别的准确性。
-
公开(公告)号:CN118032113B
公开(公告)日:2024-07-12
申请号:CN202410445606.X
申请日:2024-04-15
Applicant: 珠海高凌信息科技股份有限公司
Abstract: 本发明公开了一种噪声排放监测方法、设备及介质,方法包括:通过传声器单元获取声音信号的第一声压信号和第二声压信号;根据第一声压信号和第二声压信号计算得到声音信号的位置信息;在位置信息位于预设位置范围的情况下,根据第一声压信号和第二声压信号计算得到声音信号的噪声值;在噪声值大于或等于预设噪声阈值的情况下,将声音信号配置为工业厂区的噪声信号。通过传声器单元获取不同的声压信号,进而通过数据处理单元处理后得到声音信号的声源位置,从而确定声音信号是否为噪声信号,可实时检测工业厂区的噪声,降低了噪声监测难度和监测成本,可广泛应用于噪声监测技术领域。
-
公开(公告)号:CN118032113A
公开(公告)日:2024-05-14
申请号:CN202410445606.X
申请日:2024-04-15
Applicant: 珠海高凌信息科技股份有限公司
Abstract: 本发明公开了一种噪声排放监测方法、设备及介质,方法包括:通过传声器单元获取声音信号的第一声压信号和第二声压信号;根据第一声压信号和第二声压信号计算得到声音信号的位置信息;在位置信息位于预设位置范围的情况下,根据第一声压信号和第二声压信号计算得到声音信号的噪声值;在噪声值大于或等于预设噪声阈值的情况下,将声音信号配置为工业厂区的噪声信号。通过传声器单元获取不同的声压信号,进而通过数据处理单元处理后得到声音信号的声源位置,从而确定声音信号是否为噪声信号,可实时检测工业厂区的噪声,降低了噪声监测难度和监测成本,可广泛应用于噪声监测技术领域。
-
公开(公告)号:CN117275519B
公开(公告)日:2024-02-13
申请号:CN202311559286.2
申请日:2023-11-22
Applicant: 珠海高凌信息科技股份有限公司
Abstract: 本发明公开了一种声音类型识别修正方法、系统、装置及介质,方法包括:获取第一声音信息;将第一声音信息与云端数据库的数据信息进行比对得到第一分类信息;实时获取环境信息;根据环境信息和预设的特征修正算法对第一分类信息进行修正得到第二分类信息;将第二分类信息输入预设的云端AI识别模型进行二次分类得到第三分类信息。通过预设的云端数据库的数据信息来比对,从而保证第一声音信息的初步分类准确,并通过环境信息和特征修正算法来修正,从而优化分类结果,免除干扰,最后进过云端AI识别模型进行二次分类,更近一步保证了分类结果的准确性,从而提高了识别声音类型的准确性,可广泛应用于声音识别技术领域。
-
公开(公告)号:CN117352001A
公开(公告)日:2024-01-05
申请号:CN202311265881.5
申请日:2023-09-27
Applicant: 珠海高凌信息科技股份有限公司
Abstract: 本申请公开了一种环境噪声检测方法、装置、电子设备、存储介质,方法包括获取包括多个音频帧的待识别音频数据,将全部的音频帧按照采集音频帧的时间先后顺序放入音频切片队列;从全部的音频帧中确定参考音频帧,根据参考音频帧的参考时刻和预设滑动步长对音频切片队列中的音频帧进行切片,得到目标音频数据;将目标音频数据输入至声音识别模型,得到初始噪声识别结果;根据当前的气象信息和初始噪声识别结果确定目标噪声识别结果。本申请通过声音识别模型结合实时的气象信息得到最终的目标噪声识别结果,实现人工智能与多场景化综合识别环境噪声,相比仅采用声音识别模型识别环境噪声的方案,能够有效提升环境噪声的准确辨识率。
-
公开(公告)号:CN116403059A
公开(公告)日:2023-07-07
申请号:CN202310085966.9
申请日:2023-01-17
Applicant: 珠海高凌信息科技股份有限公司
IPC: G06V10/77 , G06V10/80 , G06V10/82 , G06N3/08 , G06N3/0464
Abstract: 本申请公开了基于多模态深度模型的环境识别方法、装置和存储介质,本申请的方法包括提取气象数据的特征、声音特征和视觉特征;使用卷积循环多核学习模型进行模型训练,卷积循环多核学习模型包括卷积神经网络和循环神经网络;通过循环神经网络来捕获静态图像中的空间结构信息,使用循环神经网络捕获视频序列中固有的空间和时间模式。本申请采用融合气象数据、声音及视频多模态数据,并通过进行多模态特征融合训练深度卷积神经网络模型结合的方法,进行环境场景识别,相比传统环境场景的识别方法,提升了环境场景识别的准确率和稳定性,本申请中提出的模型有更好的适应性,能在短时间内生成可靠的场景分析深度学习模型,提高了系统的实用价值。
-
公开(公告)号:CN116486830A
公开(公告)日:2023-07-25
申请号:CN202310392211.3
申请日:2023-04-12
Applicant: 珠海高凌信息科技股份有限公司
Abstract: 本发明提供一种环境声音描述方法、装置、电子设备及存储介质,该环境声音描述方法包括:响应于环境声音描述请求,获取第一目标环境声音,对第一目标环境声音执行预处理,得到第二目标环境声音;对第二目标环境声音采用环境声音描述模型进行识别处理,得到第一目标环境声音的描述结果;环境声音描述模型的训练包括:获取环境声音的音频数据集,对音频数据集执行音频剪辑处理,得到验证集及测试集;对验证集及测试集执行预处理,进而执行基于迁移学习处理,得到音频特征;对音频特征执行深度卷积神经网络训练处理,得到环境声音描述模型。本发明的有益效果为:提高了声源描述准确率和声源检测的扩展性。
-
公开(公告)号:CN116432745A
公开(公告)日:2023-07-14
申请号:CN202310244091.2
申请日:2023-03-14
Applicant: 珠海高凌信息科技股份有限公司
Abstract: 本发明公开了一种边缘计算深度学习模型分布式训练方法、装置和存储介质,方法包括:在终端设备和边缘节点都初始化代理,然后迭代以下过程:通过终端设备从边缘节点下载参数,将参数分配给终端设备的本地参数;基于终端设备的本地样本训练更新参数;通过终端设备上传训练更新后的参数和本地训练次数到边缘节点;通过边缘节点更新训练时间,并基于从终端设备的接收数据,通过服务器进行聚合更新参数;本申请中提出的技术可以提升边缘计算环境下的深度学习模型训练速度,从而在边缘计算与深度学习结合领域,对于提升边缘计算环境下的深度模型训练效率及数据安全保护具有重大价值,提高了系统的实用价值,可广泛应用于深度学习技术领域。
-
公开(公告)号:CN115798510A
公开(公告)日:2023-03-14
申请号:CN202211247560.8
申请日:2022-10-12
Applicant: 珠海高凌信息科技股份有限公司
Abstract: 本发明公开了一种声学场景分类方法、系统、装置及存储介质,声学场景分类方法通过对声学场景声音进行数据增强处理,采用预训练的声音分类大模型对数据增强处理得到的声学场景声音序列进行特征提取,获取第一嵌入向量,并接入深度卷积神经网络对第一嵌入向量进行分类训练,得到第一模型,进而采用第一模型对声学场景声音进行分类,生成声学场景分类结果,无需依赖大量的有标签数据进行模型训练,提高了基于小样本有标签数据的声学场景分类的准确性和稳定性,并降低了训练成本。本发明可广泛应用于计算机技术领域。
-
公开(公告)号:CN115713944A
公开(公告)日:2023-02-24
申请号:CN202211335613.1
申请日:2022-10-28
Applicant: 珠海高凌信息科技股份有限公司
IPC: G10L21/0272 , G10L21/0308 , G10L25/03 , G10L25/30
Abstract: 本申请公开了基于深度学习的声音隔离方法、装置和存储介质,本申请的方法包括获得用于构建DeepAudioSep模型的音频文件并对所述用于构建DeepAudioSep模型的音频文件进行预处理;构建DeepAudioSep模型并训练所述DeepAudioSep模型,所述DeepAudioSep模型包括一个混合源输入和十个隔离的源输出;通过所述DeepAudioSep模型进行声音分离。本申请将数据驱动和深度学习思想引入声音分离及噪声隔离处理,提升在环境监测领域对于声音分离及噪声隔离处理能力,因此具有广泛的噪声处理前景及实用价值。
-
-
-
-
-
-
-
-
-