Patent search ap:("西安电子科技大学广州研究院") AND inv:"罗小宝" Page 1

1.

发明公开
一种基于噪声分类的轻量级语音增强系统审中-实审

公开(公告)号：CN116246644A

公开(公告)日：2023-06-09

申请号：CN202310170928.3

申请日：2023-02-27

Applicant: 西安电子科技大学广州研究院

Inventor： 严体华 , 缪亚泰 , 罗小宝

IPC: G10L21/02 , G10L15/08 , G10L15/16 , G10L25/45

Abstract: 本发明涉及一种基于噪声分类的轻量级语音增强系统，属于语音信号处理技术领域，包括音频输入模块、音频处理模块和音频输出模块，所述音频输入模块，用于预处理和语音特征提取功能；所述音频处理模块，用于噪声分类和语音增强功能；所述音频输出模块，用于后处理功能；所述语音增强系统还包括处理带噪音频的以下步骤：语音信号预处理；语音特征提取；噪声分类；语音增强；后处理。本发明首先对嵌入式平台的环境噪声进行分类归纳，然后通过卷积循环网络模型对各种类型的带噪语音进行增强处理，最后对模型进行轻量化操作，降低模型的复杂度，以满足嵌入式平台的内存要求，同时保证语音增强的效果和实时性。

2.

发明公开
一种视频图像处理的加速方法、系统、设备及存储介质审中-实审

公开(公告)号：CN116366783A

公开(公告)日：2023-06-30

申请号：CN202310157612.0

申请日：2023-02-23

Applicant: 西安电子科技大学广州研究院

Inventor： 宋娟 , 张艳鑫 , 李雪俭 , 罗小宝 , 孙飞 , 陶理文

IPC: H04N5/262 , G06N3/0464 , G06N3/08 , H04N5/268 , H04N19/436

Abstract: 本发明公开了一种视频图像处理的加速方法、系统、设备及存储介质，涉及图像处理技术领域。该方法包括：采集视频帧图像并对其进行格式转换；获取关键帧和参考帧；拆解网络模型为卷积层部分和后处理部分；对关键帧进行降采样处理，获取降采样图像；将降采样图像送入卷积层部分进行推理，获取预测参数图；对预测参数图进行上采样处理，获取上采样图像并将其与视频帧图像进行像素矩阵运算，获取运算结果图。本发明采用帧差法技术保证了视频图像处理的实时性；采用NEON技术和降采样技术提升模型推理速度；将模型进行拆解，使用OpenMp并行计算，提升运算速度和模型的精确度；采用上采样技术保证输出图像分辨率不会降低，确保视频质量。

Patent Agency Ranking