基于异构多尺度卷积循环网络的回声消除方法及系统

    公开(公告)号:CN119517061A

    公开(公告)日:2025-02-25

    申请号:CN202411576166.8

    申请日:2024-11-06

    Abstract: 本发明公开了基于异构多尺度卷积循环网络的回声消除方法及系统,首先基于多帧上下文提取相关特征模式构建相关编码器,再根据单帧提取频谱模式构建频谱编码器,接着采用相关编码器和频谱编码器组成异构多尺度编码器并获得多路编码特征;本发明实现了具有利用异构双路编码器从输入混合信号频谱和参考信号频谱中提取不同特征的功能,且为适应参考信号和混合信号之间的时延情况而采用相关性编码并从多帧频谱中提取相关性特征表达,同时为了加强当前帧的频谱分辨率而采用频谱编码从当前帧中提取频谱模式表达,还实现了对于双路特征具有进一步采用通道注意力特征软选择机制融合相关性特征编码和频谱编码的功能,适合被广泛推广和使用。

    基于LSB信息隐藏的图像二维码生成方法及读取方法

    公开(公告)号:CN111598198B

    公开(公告)日:2024-04-26

    申请号:CN202010422569.2

    申请日:2020-05-18

    Abstract: 基于LSB信息隐藏的图像二维码生成方法及读取方法,生成二维码时,将二维码信息转换成二进制信息,选取彩色数字位图作为载体,将每个像素点的RGB值转换成YUV格式,将二进制信息取代YUV格式中灰度信息Y的最低位,获得新的灰度图像,将Y'UV通过反变化,恢复成RGB信息,将新的RGB信息恢复成带有二维码信息的位图。读取时,将带有二维码信息的位图读入计算机,转换成YUV格式,并读取Y矩阵的前n个值的最低位即可。本发明将二维码信息的二进制位取代图像灰度信息的最低,由于取代的是灰度信息的最低位,不影响原有图像的视觉效果,同时携带有二维码信息。在读取二维码信息时,只需将灰度图像的最低位取出,就可以恢复二维码。

    基于唇语识别的重度听障患者言语理解度的改进方法

    公开(公告)号:CN112330713B

    公开(公告)日:2023-12-19

    申请号:CN202011346536.0

    申请日:2020-11-26

    Abstract: 本发明公开了一种基于唇语识别的重度听障患者言语理解度的改进方法,包括:使用图像采集设备从现实环境中采集唇部运动图像序列,作为深度神经网络的输入特征;构建基于深度学习的视觉模态语音端点检测方法,在低信噪比条件下确认语音段位置;构建基于三维卷积‑残差网络‑双向GRU结构的深度学习模型作为基线模型;在基线模型的基础上构建基于时空信息特征的唇语识别模型;利用交叉熵损失训练网络模型,根据训练后的唇语识别模型识别出说话内容。本发明通过时空信息反馈来捕捉唇语图像的细粒度特征和时域关键帧,从而提高对复杂环境中唇语特征的适应性,提高唇语识别性能,改善了重度听障患者的语言理解能力,具有良好的应(56)对比文件Yue Xie;Cai-Rong Zou;Rui-Yu Liang;Hua-Wei Tao.Phoneme Recognition Based onDeep Belief Network《.2016 InternationalConference on Information System andArtificial Intelligence (ISAI)》.2016,全文.马宁;田国栋;周曦.一种基于long short-term memory的唇语识别方法.中国科学院大学学报.2018,(01),全文.荣传振;岳振军;贾永兴;王渊;杨宇.唇语识别关键技术研究进展.数据采集与处理.2012,(S2),全文.刘大运;房国志;骆天依;魏华杰;王倩.基于BiLSTM-Attention唇语识别的研究《.计算技术与自动化》.2020,全文.Bor-Shing Lin;Yu-Hsien Yao;Ching-FengLiu;Ching-Feng Lien;Bor-ShyhLin.Development of Novel Lip-ReadingRecognition Algorithm《.IEEE Access》.2017,全文.

    基于矩阵重构二维卷积网络的电力负载信息获取方法

    公开(公告)号:CN116341616A

    公开(公告)日:2023-06-27

    申请号:CN202211412348.2

    申请日:2022-11-11

    Abstract: 本发明公开了基于矩阵重构二维卷积网络的电力负载信息获取方法,首先采集电器的总用电功率并作为输入序列y,再在输入序列y中加入余弦位置编码并得到编码序列ye,接着对编码序列ye进行滑窗截取并得到序列重构矩阵M,随后对输入序列y进行单位延时并得到延时序列y1,再求得动态检测序列yd,然后对序列重构矩阵M进行奇异值分解并得到分解重构子矩阵Mi,再对动态检测序列yd进行滑窗截取并得到动态检测重构矩阵Md;本发明通过采用将序列延时重构为矩阵的方法,能够充分利用序列的时序特性,并能在压缩网络参数量和训练时间的前提下增加网络层数,提升了负荷监测的精度,适合被广泛推广和使用。

    基于序列延时重构CSP卷积神经网络的非侵入式负荷监测方法

    公开(公告)号:CN114745299B

    公开(公告)日:2023-06-13

    申请号:CN202210259630.5

    申请日:2022-03-16

    Abstract: 本发明公开了基于序列延时重构CSP卷积神经网络的非侵入式负荷监测方法,首先利用阵列信号处理的特性对数据集中的2xL长度时序序列通过序列延时重构为LxLx2维度的矩阵M,再针对矩阵M的特点利用CSP网络特性针对性的构建卷积神经网络,接着使用重构的矩阵M数据及CSP卷积神经网络进行训练并得到最优的网络参数,再在监测端布置网络并加载相应参数,再对输入数据进行分解,得到负荷电器的工作状态;本发明实现了在监测时考虑数据中的时序关系及状态变化,且在提升监测的精度的同时也保障了监测的效率,能够针对性的指导用户或企业合理和安全用电,并辅助电力供应部门完善电力调度工作,具有方法科学合理、适用性强和效果佳等优点。

    一种基于多源信息融合的燃烧稳定性诊断方法

    公开(公告)号:CN115578619A

    公开(公告)日:2023-01-06

    申请号:CN202211322652.8

    申请日:2022-10-27

    Abstract: 一种基于多源信息融合的燃烧稳定性诊断方法,图像采集设备捕获炉膛燃烧火焰,形成数字图像并传输至服务器;服务器接收火焰图像,同时记录不同传感器的监测信息;建立对抗降噪自编码提取火焰图像的深层特征,并设计相关性系数校正深层图像特征与传感器监测信息之间的延迟时间;随后,将深层图像特征与传感器监测信息进行融合,送至燃烧稳定性评价指标,定量估计燃烧稳定性状态。本发明所提出的燃烧稳定性诊断方法能够量化表征燃烧稳定性,为燃烧状态调整提供重要指导依据。

    一种单像素成像的信号检验方法

    公开(公告)号:CN114449258A

    公开(公告)日:2022-05-06

    申请号:CN202210091027.0

    申请日:2022-01-26

    Abstract: 本申请公开了一种单像素成像的信号检验方法,包括:单像素探测器根据被探测物体的大小设计采样矩阵并进行采样;将采样矩阵分成多组,每组包含C个采样矩阵,将每组的C个采样矩阵按照r行列的方式进行排列,针对每组的C个采样矩阵,对每一行的采样矩阵进行整合得到子矩阵,对每一列的采样矩阵进行整合得到子矩阵,并通过计算子矩阵和子矩阵各自的检验矩阵或投影矩阵来判断具体产生错误信号的采样矩阵所在位置,以实现在信号采集过程的检验。

    基于图像清晰度评价函数的高铁车轴变形检测装置及方法

    公开(公告)号:CN114413777A

    公开(公告)日:2022-04-29

    申请号:CN202210058817.9

    申请日:2022-01-18

    Abstract: 本发明提供一种基于图像清晰度评价函数的高铁车轴变形检测装置及方法,其中装置包括支架,所述支架上设置有一对输出轴平行设置的电机,所述电机的输出轴上固定连接有丝杠,所述丝杠的轴线与所述电机的输出轴的轴线共线;一对所述丝杠之间设置有垂直于所述丝杠的横杆;所述横杆的两端分别螺纹连接于一对所述丝杠上;所述横杆上均匀设置有多个定焦相机,所述定焦相机的镜头朝向车轴;所述电机和定焦相机均电连接有上位机。本发明解决了目前利用塞尺或游标卡尺的深度尺测量,得到的每米弯曲度存在测量误差且检测效率较低和利用图像提取边缘特征,会受到图像背景的干扰,造成检测的高铁车轴弯曲情况与实际的高铁车轴弯曲情况不一致的问题。

    一种改进的录音设备识别算法

    公开(公告)号:CN110728991B

    公开(公告)日:2022-03-01

    申请号:CN201910841092.9

    申请日:2019-09-06

    Abstract: 本发明公开了一种改进的录音设备识别算法,构建模型一和模型二,模型一包括双向门循环神经网络层、单向门循环神经网络层和注意力层,模型二包括卷积层、跳跃连接层和全局平均池化层,对待检测的音频信号进行分帧和预处理,提取音频信号的多维帧级特征作为模型一的输入、梅尔频谱特征作为模型二的输入,并将模型一和模型二的输出特征进行拼接融合,分类并得出识别结果。本发明的识别算法保留了音频信号的时序特性,通过增加注意力机制、跳跃连接结构和隐藏单元拼接方法等方式,最终得到优质的录音设备相关的特征参数,提高了录音设备的识别效果和模型的鲁棒性。

    基于深度域自适应网络的助听器语音增强方法

    公开(公告)号:CN111968666B

    公开(公告)日:2022-02-01

    申请号:CN202010847510.8

    申请日:2020-08-20

    Abstract: 本发明公开了一种基于深度域自适应网络的助听器语音增强方法,包括:分别从带噪语音和干净语音中提取帧级对数功率谱特征;构建基于编码器‑解码器结构的深度学习模型作为基线语音增强模型;在基线语音增强模型的基础上,构建基于深度域自适应网络的迁移学习语音增强模型;迁移学习语音增强模型在特征编码器和重建解码器之间引入域适配层和相对鉴别器;利用域对抗性损失训练迁移学习语音增强模型;在增强阶段,根据训练后的深度域自适应迁移学习语音增强模型,输入目标域带噪语音的帧级LPS特征,重建增强语音波形。本发明通过域对抗性训练来激励特征编码器生成域不变性特征,从而提高语音增强模型对未见噪声的适应性。

Patent Agency Ranking