一种基于轻量级网络的无监督机器异常声音检测方法

    公开(公告)号:CN117292714A

    公开(公告)日:2023-12-26

    申请号:CN202311316592.3

    申请日:2023-10-12

    Abstract: 本发明针对工业场景下,异常声音检测的特征组合问题,提出了一种基于轻量级网络的无监督机器异常声音检测方法,该方法使用log‑Mel谱图和SincNet谱图融合特征作为输入,使得机器工作声音的特征信息更加丰富,有利于提高轻量化网络的检测性能。检测模型是在MobileNetV3主干网络中使用了更加轻量化的ES注意力机制,既可以避免池化过程中精细特征丢失的风险,又可以进一步减小模型的计算量,使得系统可以更好的部署在移动端设备,增强机器异常声检测的实用性和灵活性。该方法不仅适用于工业场景下机器工作声音信号的异常检测,也适用于各种异常声音检测任务的移动端部署。

    基于多通道声获取的声学同时定位与建图方法

    公开(公告)号:CN109901112B

    公开(公告)日:2022-10-04

    申请号:CN201910250346.X

    申请日:2019-03-29

    Abstract: 本发明公开了基于多通道声获取的声学同时定位与建图方法,是通过多通道声获取方式,基于几何声学镜像模型,分析语音信号传播过程中的信道状态,实现室内声场环境空间感知,并利用空间感知结果提升移动声源(说话人)连续定位性能的方法。本发明方法通过引入Delaunay三角剖分方法,分析移动声源的运动状态,估计声源位置的自适应搜索子空间,避免了在室内声场全空间范围内对移动声源位置重复搜索的繁琐与冗余,提高了空间感知与移动声源定位方案的普适性,不仅适用于室内空间轮廓重构,也适用于室内环境的移动声源跟踪定位。

    基于听觉场景分析的室内环境区域定位系统及方法

    公开(公告)号:CN109031202B

    公开(公告)日:2022-10-04

    申请号:CN201810560147.4

    申请日:2018-06-03

    Abstract: 本发明公开了一种基于听觉场景分析的室内环境区域级定位系统及方法,系统包括通过无线网络连接服务器端和客户端;首先生成室内房间级的定位结果,然后根据该结果,计算该房间内的区域级定位,最终给出准确的区域内定位结果。该定位方法,包括离线阶段建立位置声纹数据库和在线阶段进行声信号的匹配两个步骤。只需要在在线阶段录制所处位置的10s音频,将音频文件转化为位置声纹,上传ABS结果,下载服务器端筛选的房间地图信息,就可以在客户端快速准确的解算出位置信息。由于ABS结果与房间地图信息,都是轻量级的数据,因此,该方法解决了现有室内区域级定位精度低,运算量庞大的问题,同时借助联觉现象,辅以CRP色彩声图呈现方式,提升用户定位体验。

    在室内声场环境中对移动声源进行实时跟踪定位的方法

    公开(公告)号:CN108828501B

    公开(公告)日:2020-07-28

    申请号:CN201810405622.0

    申请日:2018-04-29

    Abstract: 本发明在室内声场环境中对移动声源进行实时跟踪定位的方法,通过读取手机内置传感器信息,估计移动声源连续步态间的距离与转向值,分析连续步态下真实声源点及其跟随变化的镜像声源点的空间位置,构建连续步态下源点几何关系。然后,通过移动声源步态分析模块将一阶回波识别出来,并在RIR上提取其时延估值,最后基于此时延,计算镜像声源点到接收麦克风之间的声达时间差,基于非线性加权最小二乘分析模型,迭代出移动声源的空间三维坐标信息。该方法仅以室内空间几何为先验的同时,在不增加系统硬件复杂度且不依赖基础设施的情况下,有效利用多传感信息,提高移动声源在室内复杂声场环境下的跟踪定位性能,因此具有较低的复杂度和灵活的可移植性。

    一种Wi-Fi样本数据优化方法

    公开(公告)号:CN109286900B

    公开(公告)日:2020-07-17

    申请号:CN201810993696.0

    申请日:2018-08-29

    Abstract: 本发明公开了一种Wi‑Fi样本数据优化方法,所述方法采用Jaccard系数相似性和空间编码值信息来衡量Wi‑Fi样本数据两两间的相似程度,构建Wi‑Fi样本数据的相似矩阵;根据DBSCAN算法聚类原理对Wi‑Fi样本数据进行分簇,并提取Wi‑Fi样本数据的一重簇头和二重簇头;根据局部最优的原理,利用自顶向下的数据筛选方法,结合Wi‑Fi样本数据的二重簇头结果,从而得到最优的Wi‑Fi样本数据。本发明中的Wi‑Fi样本数据优化方法,利用邻近位置的Wi‑Fi数据具有一定的相似性来去除样本数据中的冗余,同时,Wi‑Fi样本数据间的空间编码信息,能够消除Jaccard系数相似性度量中的模糊问题,使得构建的Wi‑Fi指纹地图具有更强的鲁棒性,从而提高基于Wi‑Fi指纹的室内定位算法的性能。

    基于支持向量机的环境声音事件采集与传输系统

    公开(公告)号:CN109948739A

    公开(公告)日:2019-06-28

    申请号:CN201910321472.X

    申请日:2019-04-22

    Abstract: 本发明公开了一种基于支持向量机的环境声音事件采集与传输系统,它包括数据处理模块、拾音器、通信模块、电源转换模块和服务器,电源转换模块与拾音器连接,拾音器通过数据处理模块与通信模块连接,通信模块与服务器连接,通过拾音器对声音进行采集,并将声音信号传输至数据处理模块,数据处理模块对声音信号进行处理,利用先验知识结合支持向量机对声音进行识别,选择属于环境声音事件的音频数据通过无线通信网络传输至服务器,服务器接收声音数据并有序保存至数据库中。该系统能对声音进行采集与识别,有目标性的选择环境声音事件进行传输,而且能防水,续航能力强,在室内室外环境下均可使用。

    基于声学镜像模型的室内空间几何轮廓重构方法

    公开(公告)号:CN108872939A

    公开(公告)日:2018-11-23

    申请号:CN201810405623.5

    申请日:2018-04-29

    Abstract: 本发明公开了一种基于声学镜像模型的室内空间几何轮廓重构方法,包括声接收装置、相位变换广义互相关分析模块、声源定位模块、平面参数分析模块、以及声学镜像模型等,采用语音信号作为声源信号,以可移动的M阵元星形阵列作为声接收装置;首先,基于可控响应功率相位变换和区域收缩法进行声源定位;其次,基于声学镜像模型,通过声收发信号的互相关分析,获取说话人单步移动前后其距离室内各反射面的距离估值;最后,结合室内空间的形状先验,将空间几何轮廓重构问题转化为声源定位问题,通过对镜像声源位置的求解,实现室内空间几何轮廓重构。该方法可提高室内空间几何轮廓重构的准确度,同时,兼顾声源通用性,能够获得鲁棒的轮廓重构效果。

    一种混响环境下基于注意力加权的多通道语音分离方法

    公开(公告)号:CN118675542A

    公开(公告)日:2024-09-20

    申请号:CN202310247175.1

    申请日:2023-03-15

    Abstract: 本发明公开了一种混响环境下基于注意力加权的多通道语音分离方法,首先,利用多通道麦克风阵列收集混合语言;其次,对各个麦克风收集到的语音进行快速傅里叶变换得到混合语音信号时频谱,分别取各个通道语音信号的频域相位信息获得通道间相位差特征;然后引入自注意力机制的思想,采用打分加权的方式,对多组通道间相位差进行特征融合,与其它形式的特征拼接组成输入特征;最后将输入特征送入当下流行的时域卷积网络系统模型中迭代训练,得到语音分离模型。该方法采用加权打分的方式,解决了麦克风通道浪费的问题,尽可能多的使用通道间相位差,减少了语音信号空间信息的损失,使得语音分离性能得到了提升。

Patent Agency Ranking