一种基于噪声分类的轻量级语音增强系统

    公开(公告)号:CN116246644A

    公开(公告)日:2023-06-09

    申请号:CN202310170928.3

    申请日:2023-02-27

    Abstract: 本发明涉及一种基于噪声分类的轻量级语音增强系统,属于语音信号处理技术领域,包括音频输入模块、音频处理模块和音频输出模块,所述音频输入模块,用于预处理和语音特征提取功能;所述音频处理模块,用于噪声分类和语音增强功能;所述音频输出模块,用于后处理功能;所述语音增强系统还包括处理带噪音频的以下步骤:语音信号预处理;语音特征提取;噪声分类;语音增强;后处理。本发明首先对嵌入式平台的环境噪声进行分类归纳,然后通过卷积循环网络模型对各种类型的带噪语音进行增强处理,最后对模型进行轻量化操作,降低模型的复杂度,以满足嵌入式平台的内存要求,同时保证语音增强的效果和实时性。

    一种视频图像处理的加速方法、系统、设备及存储介质

    公开(公告)号:CN116366783A

    公开(公告)日:2023-06-30

    申请号:CN202310157612.0

    申请日:2023-02-23

    Abstract: 本发明公开了一种视频图像处理的加速方法、系统、设备及存储介质,涉及图像处理技术领域。该方法包括:采集视频帧图像并对其进行格式转换;获取关键帧和参考帧;拆解网络模型为卷积层部分和后处理部分;对关键帧进行降采样处理,获取降采样图像;将降采样图像送入卷积层部分进行推理,获取预测参数图;对预测参数图进行上采样处理,获取上采样图像并将其与视频帧图像进行像素矩阵运算,获取运算结果图。本发明采用帧差法技术保证了视频图像处理的实时性;采用NEON技术和降采样技术提升模型推理速度;将模型进行拆解,使用OpenMp并行计算,提升运算速度和模型的精确度;采用上采样技术保证输出图像分辨率不会降低,确保视频质量。

Patent Agency Ranking