基于声学镜像模型的室内空间几何轮廓重构方法

    公开(公告)号:CN108872939B

    公开(公告)日:2020-09-29

    申请号:CN201810405623.5

    申请日:2018-04-29

    Abstract: 本发明公开了一种基于声学镜像模型的室内空间几何轮廓重构方法,包括声接收装置、相位变换广义互相关分析模块、声源定位模块、平面参数分析模块、以及声学镜像模型等,采用语音信号作为声源信号,以可移动的M阵元星形阵列作为声接收装置;首先,基于可控响应功率相位变换和区域收缩法进行声源定位;其次,基于声学镜像模型,通过声收发信号的互相关分析,获取说话人单步移动前后其距离室内各反射面的距离估值;最后,结合室内空间的形状先验,将空间几何轮廓重构问题转化为声源定位问题,通过对镜像声源位置的求解,实现室内空间几何轮廓重构。该方法可提高室内空间几何轮廓重构的准确度,同时,兼顾声源通用性,能够获得鲁棒的轮廓重构效果。

    同步扫描成像系统
    13.
    发明授权

    公开(公告)号:CN106534632B

    公开(公告)日:2019-03-29

    申请号:CN201610952479.8

    申请日:2016-11-03

    Abstract: 本发明提供一种同步扫描成像系统,用于在人工照明条件下的成像,包括照明设备和具有CMOS图像传感器的成像设备,且均位于扫描成像目标的同一侧,所述成像设备与所述照明设备间距大于设定最远成像距离的1/2,其特征在于所述成像设备利用CMOS图像传感器滚动曝光电子快门,所述照明设备受控发出线状或窄带照明光束对成像目标区域逐行扫描并与所述成像设备滚动曝光同步。本发明提供的同步扫描成像系统减少了照明光的后向散射区体积,实现方便、快速同步扫描控制。

    在室内声场环境中对移动声源进行实时跟踪定位的方法

    公开(公告)号:CN108828501A

    公开(公告)日:2018-11-16

    申请号:CN201810405622.0

    申请日:2018-04-29

    CPC classification number: G01S1/76

    Abstract: 本发明在室内声场环境中对移动声源进行实时跟踪定位的方法,通过读取手机内置传感器信息,估计移动声源连续步态间的距离与转向值,分析连续步态下真实声源点及其跟随变化的镜像声源点的空间位置,构建连续步态下源点几何关系。然后,通过移动声源步态分析模块将一阶回波识别出来,并在RIR上提取其时延估值,最后基于此时延,计算镜像声源点到接收麦克风之间的声达时间差,基于非线性加权最小二乘分析模型,迭代出移动声源的空间三维坐标信息。该方法仅以室内空间几何为先验的同时,在不增加系统硬件复杂度且不依赖基础设施的情况下,有效利用多传感信息,提高移动声源在室内复杂声场环境下的跟踪定位性能,因此具有较低的复杂度和灵活的可移植性。

    一种基于多种设备有监督域自适应的声场景分类方法

    公开(公告)号:CN116386599A

    公开(公告)日:2023-07-04

    申请号:CN202310369908.9

    申请日:2023-04-10

    Abstract: 本发明属于声音场景分类领域,具体是指一种基于多种设备有监督域自适应的声场景分类方法,其特征在于,包括如下步骤,S1:对场景音频信号进行预处理;S2:进行傅里叶变换,进行梅尔滤波处理,再进行频段标准化修正,提取三个特征频谱图,融合三个特征频谱图得到三维声学特征。S3:将步骤S2得到的三维声学特征输入数据增强模块,得到经过数据增强后的三维声学特征;S4:构建有监督域自适应声场景分类模型;S5:进行有监督训练,得到训练好的有监督域自适应声场景分类模型;S6:得到分类结果。本发明具有结构简单、分类效果好、适应范围广的优点。

    一种球谐域下多目标波束形成器优化方法

    公开(公告)号:CN116362137A

    公开(公告)日:2023-06-30

    申请号:CN202310363719.0

    申请日:2023-04-07

    Abstract: 本发明涉及球谐域下的多目标波束优化问题,具体给出一种基于多目标智能优化算法的球谐域下多目标波束优化方法。该方法利用球谐域下波束形成器的白噪声增益和方向性因子的表达式是正定二次型的特点,预先为它们设置阈值,并以此确定待优化的波束形成权值的范围,在此基础上将球谐域下波束优化问题转换多目标优化问题,最后使用带约束处理的NSGA‑Ⅱ算法求解该问题,得到一个各目标满足帕累托最优的波束形成权重的集合,以此实现了球谐域下最优波束形成器的设计。该方法能使波束形成器的整体旁瓣水平、方向性因子、白噪声增益三个性能指标满足帕累托最优的波束形成权重,且不存在复杂的参数调节过程。

    基于自适应宽度自注意力机制的轻量化异常声事件检测方法

    公开(公告)号:CN114386518A

    公开(公告)日:2022-04-22

    申请号:CN202210039999.5

    申请日:2022-01-14

    Abstract: 本发明公开了基于自适应宽度自注意力机制的轻量化异常声事件检测方法,该方法首先把带标签的音频进行信号处理得到它的某种时频特征表示;其次,把带标签的特征表示(通常是向量或矩阵)当作输入,给自适应宽度自注意力机制模型,然后,自适应宽度自注意力机制模型中有定义好的损失函数和随机初始化注意力权重,根据自适应自注意力机制算法算出和标签的损失值,接下来用反向传播算法,更新自适应注意力权重,通过对注意力三个输入权重持续进行更新迭代,直到损失函数达到最小或理想状态。最后,使用轻量化的方法保存此时的权重参数,接下来以此权重参数为模型对一段未标注的音频做预测,快速准确的对发生的异常声事件。

    一种基于RIR倒谱提取一阶回波的声SLAM系统及方法

    公开(公告)号:CN114111785A

    公开(公告)日:2022-03-01

    申请号:CN202111259582.1

    申请日:2021-10-28

    Abstract: 本发明涉及室内定位技术领域,具体涉及一种基于RIR倒谱提取一阶回波的声SLAM系统及方法,在机器人移动时通过声脉冲发生器主动发射高频脉冲信号;利用共址微小麦克风阵列接收、量化和存储高频脉冲信号经反射体作用后的回波信号;通过回波提取器提取回波信号的RIR倒谱特征,辨识反射体和与反射体对应的一阶回波,通过位姿优化器利用一阶回波估计的镜像声源位置,结合IMU实时位姿估计,最小化所有观测点的负对数似然和,优化IMU与声传感器估计位姿的权重,进而计算、绘制和显示机器人的移动轨迹和室内轮廓地图;解决了传统激光/视觉SLAM高成本、高复杂度及视觉采集带来的隐私安全问题,改善了声SLAM的定位精度和复杂度。

    一种可辨识LOS/NLOS声信号的智能手机室内定位系统和方法

    公开(公告)号:CN111551180A

    公开(公告)日:2020-08-18

    申请号:CN202010441441.0

    申请日:2020-05-22

    Abstract: 本发明公开了一种可辨识LOS/NLOS声信号的智能手机室内定位系统和方法。该系统采用主动式的定位方案,包括都具有网络通信能力的智能手机、接收器以及服务器;智能手机与接收器通过伪超声信号进行连接,服务器通过网络与智能手机和接收器进行通信。本发明定位方法选取调制方式为线性调频Chirp的伪超声音频信号作为定位信号,提高了系统的抗干扰能力,并使用SVM与DS证据理论信息融合的分类算法对非视距NLOS测量数据进行识别以及丢弃,构造了一套较精确的室内定位系统及方法。由于智能手机的扬声器和普通麦克风可以发送和接收伪超声定位信号,从而大大降低了系统的成本。

Patent Agency Ranking