-
公开(公告)号:CN115544297A
公开(公告)日:2022-12-30
申请号:CN202211162960.9
申请日:2022-09-23
Applicant: 珠海高凌信息科技股份有限公司
IPC: G06F16/683 , G06F16/61 , G06N5/02
Abstract: 本发明公开了一种声音数据库构建及智能检索方法、系统及存储介质,方法包括:获取原始音频数据;对原始音频数据进行数据预处理,得到声音元数据;根据原始音频数据和声音元数据,构建声音数据库及知识图谱;响应于目标对象的检索数据,基于声音数据库及知识图谱匹配返回检索结果;其中,检索数据包括检索文本和检索音频。本发明通过对原始音频数据的预处理,提取声音元数据;进而构建声音数据库及知识图谱,实现基于声音元数据以及原始音频数据声音检索的全文索引。通过声音数据库的创建,并基于知识图谱实现了基于元数据和音频数据的检索功能,能够实现包含多特性的声音检索技术,可广泛应用于数据检索技术领域。
-
公开(公告)号:CN118329188B
公开(公告)日:2024-10-11
申请号:CN202410242662.3
申请日:2024-03-04
Applicant: 珠海高凌信息科技股份有限公司
Abstract: 本发明提出了基于阈值联动触发策略的噪声监测数据分析方法及其装置,该方法包括:将监测时间段划分为多个连续的监测时间分段;设置联动阈值,当触发检测时长所对应的第一A计权等效声压级大于联动阈值,触发检测分析功能,基于目标采集时长确定滑动步长;基于滑动步长对目标事件进行切片;基于事件切片的第二A计权等效声压级确定切片分析结果;基于切片起止时刻将事件切片归类至监测时间分段;基于全部的监测时间分段的分段分析结果确定监测时间段的目标分析结果。根据本发明实施例的技术方案,能够在检测到目标事件后通过联动阈值触发事件切片,以多个切片对目标事件进行噪声分析,有效提高噪声分析的准确性。
-
公开(公告)号:CN117541735A
公开(公告)日:2024-02-09
申请号:CN202311386933.4
申请日:2023-10-24
Applicant: 珠海高凌信息科技股份有限公司
Abstract: 本发明提供一种基于倾斜摄影模型构建动态三维噪声地图的方法,包括完成倾斜摄影和像控点测量数据采集;将获取到的原始影像数据进行图像处理,获得最佳成像效果的倾斜摄影数据;基于倾斜摄影数据形成完整的CIM城市信息三维模型,根据修正后的源清单信息构建噪声地图计算模型,将数据代入噪声地图计算模型进行动态计算,结合声源噪声拟合算法和噪声传播衰减算法,计算生成基础三维噪声地图,并利用监测数据进行修正,根据瞬时、小时、昼夜等频生成动态噪声地图数据,并结合噪声地图原始数据在cesium三维渲染引擎上进行地图数据更新。本发明以三维地图为基础,融合CIM实景三维模型、城市实时动态噪声地图模型,实现实时动态的噪声地图一屏统览。
-
公开(公告)号:CN117351995A
公开(公告)日:2024-01-05
申请号:CN202311247442.1
申请日:2023-09-25
Applicant: 珠海高凌信息科技股份有限公司
Abstract: 本发明提出了一种基于深度学习复合模型的环境声音识别方法及装置,该方法包括:获取环境音频,对环境音频进行特征提取得到环境音频特征,将环境音频特征输入预先训练好的复合模型,复合模型包括多个网络结构不同的通用模型;通过通用模型识别出各个类别标签对应的通用识别置信度;基于通用模型的模型权值和通用识别置信度,确定各个类别标签的目标加权置信度作为通用模型的分类输出结果;根据目标加权置信度的均值得到复合模型的输出结果。根据本发明实施例的技术方案,能够通过多个不同网络结构的通用模型对环境音频识别的置信度进行加权融合,能够降低分类识别的过拟合风险,增强泛化能力,能够在长期使用场景下维持对环境音频识别的准确性。
-
公开(公告)号:CN117275519A
公开(公告)日:2023-12-22
申请号:CN202311559286.2
申请日:2023-11-22
Applicant: 珠海高凌信息科技股份有限公司
Abstract: 本发明公开了一种声音类型识别修正方法、系统、装置及介质,方法包括:获取第一声音信息;将第一声音信息与云端数据库的数据信息进行比对得到第一分类信息;实时获取环境信息;根据环境信息和预设的特征修正算法对第一分类信息进行修正得到第二分类信息;将第二分类信息输入预设的云端AI识别模型进行二次分类得到第三分类信息。通过预设的云端数据库的数据信息来比对,从而保证第一声音信息的初步分类准确,并通过环境信息和特征修正算法来修正,从而优化分类结果,免除干扰,最后进过云端AI识别模型进行二次分类,更近一步保证了分类结果的准确性,从而提高了识别声音类型的准确性,可广泛应用于声音识别技术领域。
-
公开(公告)号:CN115312075A
公开(公告)日:2022-11-08
申请号:CN202210910044.2
申请日:2022-07-29
Applicant: 珠海高凌信息科技股份有限公司
Abstract: 本发明提供一种噪声声源事件检测方法、装置、电子设备及存储介质,该噪声声源事件检测方法包括:获取噪声声源的多声道音频;对多声道音频执行特征提取,得到第一特征序列;通过卷积神经网络对第一特征序列执行正则化及降维处理,得到第二特征序列;通过循环卷积神经网络对第二特征序列确定时间序列信息,得到第三特征序列;对第三特征进行映射及分类,确定多声道音频的声音事件和到达方向。本发明的有益效果为:提高了准确率和声源检测的扩展性,易于扩展到不同的阵列结构。
-
公开(公告)号:CN116502174A
公开(公告)日:2023-07-28
申请号:CN202310113211.5
申请日:2023-02-13
Applicant: 珠海高凌信息科技股份有限公司
IPC: G06F18/25 , G10L25/03 , G10L25/51 , G10L25/30 , G06F18/243 , G06N3/0464 , G06N3/044 , G06N3/045 , G06N3/084 , G06V10/80 , G06V10/764 , G06V10/82
Abstract: 本发明公开了一种基于多模态深度学习的环境识别方法及装置,方法包括:利用归一化方法从气象数据中提取定长维度的第一特征向量;从音频数据中提取声学场景声音序列的第二特征向量;从图像数据中提取包含2D特征的第三特征向量;气象数据、音频数据及图像数据为在同一时间对目标环境采集得到的数据;将第一特征向量、第二特征向量及第三特征向量输入包括卷积神经网络与循环神经网络的多模态深度模型,得到包括气象数据、音频数据及图像数据融合特征的融合特征向量;通过MKL多核分类器根据融合特征向量各个通道对应的权重确定目标环境的类别。本发明可以提高环境识别的准确性,可广泛应用于环境学习领域。
-
公开(公告)号:CN115866194A
公开(公告)日:2023-03-28
申请号:CN202211432313.5
申请日:2022-11-15
Applicant: 珠海高凌信息科技股份有限公司
Abstract: 本申请公开了本申请实施例提供的基于噪声源方向的跟踪摄像取证系统、方法和装置,本申请的系统包括声定位阵列单元、噪声超标定位单元;所述声定位阵列单元定位监控范围内出现的噪声信号,锁定噪声源发生方向;所述噪声超标定位单元用于根据所述噪声源发生方向定位噪声源位置。本申请能够准确锁定噪声源精准位置,为噪声处理提供违法证据。
-
公开(公告)号:CN114974302A
公开(公告)日:2022-08-30
申请号:CN202210484489.9
申请日:2022-05-06
Applicant: 珠海高凌信息科技股份有限公司
Abstract: 本申请公开了环境声音事件检测方法、装置和介质,其中方法包括对环境声音进行特征提取,得到数据集,所述数据集中包含多事件类别;分别以所述数据集中的Mel、MFCC和LogMel作为输入特征;用双向GRU对所述输入特征进行训练;获得环境声音多分类模型概率输出。对比传统的应用于声音处理的深度学习方法,本申请先通过CNN提取事件音频的声谱图作为特征输入;双向GRU自动从每个输入声谱图中提取特征序列,在卷积网络之上,构建了一个循环网络,用于对卷积层的输出特征序列进行声学建模,建立内部序列关系;最后通过分类函数对音频信号进行预测,得到最终预测结果,在多事件音频检测这一任务上性能较高,比使用单一的卷积网络应用性更强,提高了系统的实用价值。
-
公开(公告)号:CN114882909A
公开(公告)日:2022-08-09
申请号:CN202210403964.5
申请日:2022-04-18
Applicant: 珠海高凌信息科技股份有限公司
IPC: G10L25/51 , G10L25/30 , G10L21/0332 , G10L21/0208
Abstract: 本申请公开了一种环境声音分类分析方法、装置和介质,其中的方法包括:对语音训练数据进行数据增强;进行数据预处理并对环境声音进行特征提取,得到特征向量;采用深度CNN网络对所述特征向量进行模型训练,获得所述环境声音的多分类模型并输出。本申请采用了数据增强的方法,通过实验表明其训练效果相比没有数据增强有了较大提升,提高了系统的实用价值。
-
-
-
-
-
-
-
-
-