-
公开(公告)号:CN119229881A
公开(公告)日:2024-12-31
申请号:CN202411300953.X
申请日:2024-09-18
Applicant: 大连理工大学
IPC: G10L19/02 , G10L19/038 , G10L19/26 , G10L19/16
Abstract: 本发明公开了一种基于MDCT系数残差矢量量化的分层语音编解码方法,包括:对用于训练的语音数据进行预处理,训练生成MDCT的多级量化码书;将待编码语音通过预加重滤波器增强高频分量,并对预加重后的语音信号加窗处理后基于FFT算法生成MDCT系数,根据码率确定比特分配模式生成编码控制比特,对码书索引与编码控制比特通过霍夫曼编码压缩后将码流传输至信道中;读取信道中的码流并通过霍夫曼解码得到编码控制比特和MDCT码书索引,通过编码控制比特确定语音采样率与比特分配模式,基于MDCT码书索引检索得到MDCT矢量,通过去加重滤波还原原始的语音信号。本发明通过对MDCT分层编码的设计,使得编码器可视码率情况动态调节编码比特分配,从而适应实际的通信环境并应对突发网络情况。
-
公开(公告)号:CN118334101A
公开(公告)日:2024-07-12
申请号:CN202410507424.0
申请日:2024-04-25
Applicant: 大连理工大学
IPC: G06T7/55 , G06T7/70 , G06N3/0464 , G06N3/048 , G06N3/084
Abstract: 本发明公开了一种基于多尺度注意力的双流单目深度估计方法,包括:获取原始单目图及该原始单目图对应的真实深度图像,基于原始单目图和真实深度图像建立训练集和测试集,构造基于多尺度注意力的双流单目深度估计网络,所述双流单目深度估计网络包括双流编码器、多尺度注意力特征融合单元、引导式解码器和垂直注意力单元;构建双流单目深度估计网络的损失函数,在划分好的训练集上训练双流单目深度估计网络,利用反向传播算法传递该网络的梯度值,反复迭代该网络参数、控制预测深度逼近真实深度从而获得最佳权重,完成该双流单目深度估计网络的训练过程;将测试集中的图像输入至加载最佳权重的双流单目深度网络中,获得RGB单目图对应的深度图。
-
公开(公告)号:CN110927669B
公开(公告)日:2023-07-07
申请号:CN201911287511.5
申请日:2019-12-14
Applicant: 大连理工大学
IPC: G01S5/26
Abstract: 本发明公开了一种用于无线声传感器网络的CS多声源定位方法及系统,其中方法包括:压缩麦克风拾取到的连续语音信号进行分帧处理,将声源和麦克风分布的三维空间划分为网格结构,根据区域中心坐标和几何关系计算声源从每个区域中心到达参考麦克风和到达各个压缩麦克风之间的时间差;根据时间差信息参考麦克风接收到的语音信号进行移位,将从不同区域中接收到的声源特征采用稀疏基矩阵表示;根据每一帧的压缩信号和稀疏基矩阵采用OMP算法求解优化模型重建每一帧的稀疏模式向量;根据稀疏模式向量、对多帧稀疏模式向量进行融合计算得出具有区域位置信息的稀疏模式矩阵;根据稀疏模式矩阵对声源进行精确定位,获得声源在房间中的具体位置。
-
公开(公告)号:CN111312275B
公开(公告)日:2023-04-25
申请号:CN202010090988.0
申请日:2020-02-13
Applicant: 大连理工大学
IPC: G10L21/0272 , G10L21/0308 , G10L21/0216 , G10L25/24 , G10L17/00 , G10L17/02 , G10L17/04 , G10L25/78 , G10L25/84
Abstract: 本发明公开了一种基于子带分解的在线声源分离增强系统,具体包括子带分解模块、语音活动检测模块、特征提取模块、说话人识别模块、参数估计模块、声源分离模块、后置滤波模块和子带合成模块。该系统利用识别出的说话人单独发声的片段估计对应声源的相对传递函数RTF,实现了实时的相对传递函数RTF估计,同时降低了其他声源信号对某个特定声源相对传递函数RTF估计的干扰;同时该系统提高了传统KNN说话人识别的准确率,并且在噪声干扰较大时也能有较高的识别准确率。
-
公开(公告)号:CN115264408A
公开(公告)日:2022-11-01
申请号:CN202210732172.2
申请日:2022-06-23
Applicant: 大连理工大学
IPC: F17D5/06
Abstract: 本发明公开了一种基于音频处理的管道泄漏检测方法及系统,其中方法具体包括:对采集到音频的时域长序列信号x(n)进行时域分帧加窗预处理获得多帧信号;针对音频信号,提取出具有良好分类效果的音频特征:采用傅里叶变换对帧信号进行处理获得信号的频谱分布,将频谱进行特定的切分,计算不同频带的能量占比,得到单帧特征分布;得到联合特征:利用多帧信号的动态特征,将多帧信号串联输入,构成了高维联合特征;将得到的音频特征输入到训练好的神经网络模型中,网络输出为帧标签值;统计得到的帧标签结果,进行标签平滑与标签融合,最终得到管道是否存在泄漏的判决结果。
-
公开(公告)号:CN114724574A
公开(公告)日:2022-07-08
申请号:CN202210157383.8
申请日:2022-02-21
Applicant: 大连理工大学
IPC: G10L21/0216 , G10L21/0232 , G10L21/0208
Abstract: 本发明公开了一种期望声源方向可调的双麦克风降噪方法,包括:预处理过程,将双麦克风接收的带噪信号x1(t)和x2(t)进行离散采样、预加重、分帧及加窗处理,再经过短时傅里叶变换,得到频域信号X1(ω)和X2(ω);波束形成过程,在双麦克风连线的中点处引入虚拟麦克风,根据中心差分格式对频域信号X1(ω)和X2(ω)进行差分变换,构造差分信号Y1(ω)和Y2(ω)。计算差分信号Y1(ω)和Y2(ω)的功率谱的统计平均值,并将统计平均值的比值记为方向性函数Γ(ω,θ),分析方向性函数Γ(ω,θ)的性质,通过归一化函数将其直接映射为噪声掩蔽值λ(ω)。将X1(ω)与λ(ω)相乘得到消除掉竞争方向噪声后的信号R1(ω);后置维纳滤波过程,对R1(ω)中的信号能量和噪声能量进行估计得到通道信噪比并计算增益函数,进一步消除R1(ω)中的残余噪声。
-
公开(公告)号:CN107370699B
公开(公告)日:2021-02-02
申请号:CN201710551420.2
申请日:2017-07-07
Applicant: 大连理工大学
Abstract: 本发明公开了一种NB‑IoT小区搜索系统,在运算过程中,对主同步信号进行128倍降采样,求得帧起始位置。频偏捕获时,利用NB‑IoT主同步信号中第一个符号的最后CP长度的点的数据信息和第2个符号的CP数据的重复性进行频偏的粗估计。再利用前两个符号的完整符号信息的时域周期性进行频偏的细估计。将降采样的MIB补偿频偏后进行时频转换,完成NRS位置检测,进而缩小小区ID的检测范围。本发明的小区ID检测,将接收序列中的辅同步信号分为5段,与本地的所有辅同步信号分别相关,利用每次相关的结果逐步缩小区ID范围,最终解出小区ID。
-
公开(公告)号:CN110927669A
公开(公告)日:2020-03-27
申请号:CN201911287511.5
申请日:2019-12-14
Applicant: 大连理工大学
IPC: G01S5/26
Abstract: 本发明公开了一种用于无线声传感器网络的CS多声源定位方法及系统,其中方法包括:压缩麦克风拾取到的连续语音信号进行分帧处理,将声源和麦克风分布的三维空间划分为网格结构,根据区域中心坐标和几何关系计算声源从每个区域中心到达参考麦克风和到达各个压缩麦克风之间的时间差;根据时间差信息参考麦克风接收到的语音信号进行移位,将从不同区域中接收到的声源特征采用稀疏基矩阵表示;根据每一帧的压缩信号和稀疏基矩阵采用OMP算法求解优化模型重建每一帧的稀疏模式向量;根据稀疏模式向量、对多帧稀疏模式向量进行融合计算得出具有区域位置信息的稀疏模式矩阵;根据稀疏模式矩阵对声源进行精确定位,获得声源在房间中的具体位置。
-
公开(公告)号:CN104809463B
公开(公告)日:2018-07-13
申请号:CN201510242755.7
申请日:2015-05-13
Applicant: 大连理工大学
Abstract: 本发明公开了一种基于密集尺度不变特征转换字典学习的高精度火灾火焰检测方法,包括以下步骤:S1:对视频流进行运动检测获取运动目标;S2:进行颜色检测,获取具有火焰特征的目标:对S1获得的运动目标的HSI颜色特征判断,获得具有火焰特征颜色的像素;S3:对符合运动检测和颜色检测的像素基于Dense‑SIFT字典学习进行空域形态特征判别;S4:对上述获取的目标结合时域上闪烁特征综合判别:在S3进行空域形态特征检测的基础上,结合时域动态闪烁特征,计算火焰像素点的个数与设定的阈值比较,综合判定实现对火焰的检测。
-
公开(公告)号:CN106162499B
公开(公告)日:2018-02-23
申请号:CN201610514079.9
申请日:2016-07-04
Applicant: 大连理工大学
IPC: H04S1/00
Abstract: 本发明属于信号处理技术领域,提供了一种头相关传递函数的个性化方法及系统。该方法及系统首先建立距离模型,得到与距离相关的声源信号,之后利用PCA分别给水平角和高度角建模,在HRTF的个性化调节过程中,利用与距离相关的声源信号对模型参数进行个性化调节,以感受到声源的正确方位,继而获得个性化的HRTF,实现了结构化HRTF模型与PCA系数调节的结合,由于建立的距离模型考虑到了声源与双耳之间的距离因素,使得测量者可以感受到距离的变化,因而获得的HRTF的个性化效果好、精确度高。
-
-
-
-
-
-
-
-
-