一种声音数据库构建及智能检索方法、系统及存储介质

    公开(公告)号:CN115544297A

    公开(公告)日:2022-12-30

    申请号:CN202211162960.9

    申请日:2022-09-23

    Abstract: 本发明公开了一种声音数据库构建及智能检索方法、系统及存储介质,方法包括:获取原始音频数据;对原始音频数据进行数据预处理,得到声音元数据;根据原始音频数据和声音元数据,构建声音数据库及知识图谱;响应于目标对象的检索数据,基于声音数据库及知识图谱匹配返回检索结果;其中,检索数据包括检索文本和检索音频。本发明通过对原始音频数据的预处理,提取声音元数据;进而构建声音数据库及知识图谱,实现基于声音元数据以及原始音频数据声音检索的全文索引。通过声音数据库的创建,并基于知识图谱实现了基于元数据和音频数据的检索功能,能够实现包含多特性的声音检索技术,可广泛应用于数据检索技术领域。

    基于阈值联动触发策略的噪声监测数据分析方法及其装置

    公开(公告)号:CN118329188B

    公开(公告)日:2024-10-11

    申请号:CN202410242662.3

    申请日:2024-03-04

    Abstract: 本发明提出了基于阈值联动触发策略的噪声监测数据分析方法及其装置,该方法包括:将监测时间段划分为多个连续的监测时间分段;设置联动阈值,当触发检测时长所对应的第一A计权等效声压级大于联动阈值,触发检测分析功能,基于目标采集时长确定滑动步长;基于滑动步长对目标事件进行切片;基于事件切片的第二A计权等效声压级确定切片分析结果;基于切片起止时刻将事件切片归类至监测时间分段;基于全部的监测时间分段的分段分析结果确定监测时间段的目标分析结果。根据本发明实施例的技术方案,能够在检测到目标事件后通过联动阈值触发事件切片,以多个切片对目标事件进行噪声分析,有效提高噪声分析的准确性。

    一种基于多模态深度学习的环境识别方法及装置

    公开(公告)号:CN116502174A

    公开(公告)日:2023-07-28

    申请号:CN202310113211.5

    申请日:2023-02-13

    Inventor: 石磊 宋卫华

    Abstract: 本发明公开了一种基于多模态深度学习的环境识别方法及装置,方法包括:利用归一化方法从气象数据中提取定长维度的第一特征向量;从音频数据中提取声学场景声音序列的第二特征向量;从图像数据中提取包含2D特征的第三特征向量;气象数据、音频数据及图像数据为在同一时间对目标环境采集得到的数据;将第一特征向量、第二特征向量及第三特征向量输入包括卷积神经网络与循环神经网络的多模态深度模型,得到包括气象数据、音频数据及图像数据融合特征的融合特征向量;通过MKL多核分类器根据融合特征向量各个通道对应的权重确定目标环境的类别。本发明可以提高环境识别的准确性,可广泛应用于环境学习领域。

    环境声音事件检测方法、装置和介质

    公开(公告)号:CN114974302A

    公开(公告)日:2022-08-30

    申请号:CN202210484489.9

    申请日:2022-05-06

    Abstract: 本申请公开了环境声音事件检测方法、装置和介质,其中方法包括对环境声音进行特征提取,得到数据集,所述数据集中包含多事件类别;分别以所述数据集中的Mel、MFCC和LogMel作为输入特征;用双向GRU对所述输入特征进行训练;获得环境声音多分类模型概率输出。对比传统的应用于声音处理的深度学习方法,本申请先通过CNN提取事件音频的声谱图作为特征输入;双向GRU自动从每个输入声谱图中提取特征序列,在卷积网络之上,构建了一个循环网络,用于对卷积层的输出特征序列进行声学建模,建立内部序列关系;最后通过分类函数对音频信号进行预测,得到最终预测结果,在多事件音频检测这一任务上性能较高,比使用单一的卷积网络应用性更强,提高了系统的实用价值。

Patent Agency Ranking