一种面向威廉斯综合症的面部图像分析系统

    公开(公告)号:CN119785403A

    公开(公告)日:2025-04-08

    申请号:CN202411879010.7

    申请日:2024-12-19

    Abstract: 本发明公开了一种面向威廉斯综合症的面部图像分析系统,包括:面部检测模块,用于识别并裁剪面部图像中的人脸区域,得到训练图像和测试图像;面部特征提取模块,用于根据训练图像,通过MobileFaceNet网络提取局部面部区域并重映射坐标值;其中局部面部区域包括:眼部区域、鼻子区域、嘴巴区域;逐像素加权模块,用于对训练图像的局部面部区域进行加权处理,得到加权图像;网络训练模块,用于通过VMamba网络对加权图像进行分类预测,得到训练好的VMamba网络;图像分析模块,用于将测试图像输入至训练好的VMamba网络,得到面向威廉斯综合症的面部图像分析结果。本发明能够准确分析具有威廉斯综合证的面孔图像。

    视频超分辨率方法、系统、电子设备及存储介质

    公开(公告)号:CN119205513A

    公开(公告)日:2024-12-27

    申请号:CN202411586232.X

    申请日:2024-11-08

    Inventor: 王鑫 徐勇

    Abstract: 本发明公开了一种视频超分辨率方法、系统、电子设备及存储介质,所述方法包括建立复杂运动场景下的视频超分辨率模型并训练和测试所述模型,模型包括特征提取子模块、跨帧对齐子模块、特征增强子模块和上采样重建子模块,特征提取子模块用于提取输入连续视频帧的浅层特征;跨帧对齐子模块利用可变形卷积对不同帧进行特征级对齐,实现跨帧的时空信息融合和运动补偿;特征增强子模块对特征进行增强;上采样重建子模块针对特征增强子模块输出的增强特征进行分辨率放大,并将分辨率放大后的增强特征重构为视频帧。本发明提高了复杂运动场景下视频的超分效果,增强视频的质量和视觉效果。

    全景图像超分辨率方法、系统、电子设备及存储介质

    公开(公告)号:CN118799187B

    公开(公告)日:2024-12-10

    申请号:CN202411281438.1

    申请日:2024-09-13

    Inventor: 王鑫 徐勇

    Abstract: 本发明公开了一种全景图像超分辨率方法、系统、电子设备及存储介质,包括:建立基于纬度分级强化的全景图像超分辨率模型,模型包括特征提取子网、深度特征增强子网、上采样子网和重建子网,特征提取子网用于提取输入全景图片的浅层特征;深度特征增强子网通过级联的纬度分级强化单元,对不同纬度区域的浅层特征进行分等级的深度增强,基于全景图像中不同纬度区域特征分布的差异性,提炼不同纬度的高频信息,得到增强特征;上采样子网采用亚像素卷积层放大增强特征的空间分辨率尺寸;重建子网将放大后的增强特征复原成高分辨率全景图;本发明解决了全景图像中不同纬度特征分布的差异性难题,提高对不同场景环境下全景图像的超分效果。

    一种基于自注意力机制的环境噪声监测方法

    公开(公告)号:CN118866011A

    公开(公告)日:2024-10-29

    申请号:CN202411333837.8

    申请日:2024-09-24

    Inventor: 胡锐 徐勇

    Abstract: 本发明属于环境噪声监测技术领域,本发明公开了一种基于自注意力机制的环境噪声监测方法,包括以下步骤:通过短时傅里叶变换将音频信号转换为频谱图;通过自注意力机制提取频谱图的声纹特征;通过神经网络声纹特征对应到具体的环境声源类别,本发明通过利用短时傅里叶变换将音频信号转换为频谱图,并结合自注意力机制提取频谱图中的声纹特征,实现了对环境声音的多维度监测与分析。这种方法能够捕捉到声音的频率、能量分布、时间变化等丰富信息,为环境声监测提供更加全面和准确的指标,并且自注意力机制能够自动学习频谱图中的关键信息,并赋予其更高的权重,从而有效提取出对分类任务至关重要的声纹特征。

    一种面向文本图像的超分辨率方法

    公开(公告)号:CN118505504A

    公开(公告)日:2024-08-16

    申请号:CN202410500537.8

    申请日:2024-04-24

    Inventor: 劳明铭 徐勇

    Abstract: 本发明属于图像处理技术领域,且公开了一种面向文本图像的超分辨率方法,包括:生成文本超分数据集,识别并转换图像中目标文本区域为矩形,以便输入超分网络,提取待超分图像的特征,得到特征图X0,利用文本先验提取模块生成注意力图A,将特征图X0与注意力图A通过多个带注意力机制的残差块进行升维,得到特征图Xn,对特征图Xn进行像素和通道重组,生成超分图像SR,计算SR图像的文本序列损失lctc和像素间损失l2,求得总损失l。通过迭代优化网络参数,评估模型性能,将SR图像输入文本识别模型,获取预测文本,逆变换后拼接到原图,增强视觉效果,有效解决了传统超分模型对于文本图像质量的提升效果有限甚至产生负优化效果的问题。

    一种基于自注意力机制的环境噪声监测方法

    公开(公告)号:CN118866011B

    公开(公告)日:2025-02-07

    申请号:CN202411333837.8

    申请日:2024-09-24

    Inventor: 胡锐 徐勇

    Abstract: 本发明属于环境噪声监测技术领域,本发明公开了一种基于自注意力机制的环境噪声监测方法,包括以下步骤:通过短时傅里叶变换将音频信号转换为频谱图;通过自注意力机制提取频谱图的声纹特征;通过神经网络声纹特征对应到具体的环境声源类别,本发明通过利用短时傅里叶变换将音频信号转换为频谱图,并结合自注意力机制提取频谱图中的声纹特征,实现了对环境声音的多维度监测与分析。这种方法能够捕捉到声音的频率、能量分布、时间变化等丰富信息,为环境声监测提供更加全面和准确的指标,并且自注意力机制能够自动学习频谱图中的关键信息,并赋予其更高的权重,从而有效提取出对分类任务至关重要的声纹特征。

    一种具有图像类型适应性的超分辨率图像处理方法与系统

    公开(公告)号:CN111724303B

    公开(公告)日:2024-11-29

    申请号:CN202010398292.4

    申请日:2020-05-12

    Inventor: 徐勇

    Abstract: 本发明提供了一种具有图像类型适应性的超分辨率图像处理方法,包括以下步骤:S1、构建基于多类型图像的“通用”超分辨率模,将待处理图像作为基于多类型图像的“通用”超分辨率模的输入,运行基于多类型图像的“通用”超分辨率模型后,得出待处理图像的初步高分辨率图像;S2、构建基于单一类型图像的“精细”超分辨率模型,将初步高分辨率图像作为基于单一类型图像的“精细”超分辨率模型的输入,运行基于单一类型图像的“精细”超分辨率模型后,得出最终的高分辨率图像。本发明还提供了一种具有图像类型适应性的超分辨率图像处理系统。本发明的有益效果是:在提升图像分辨率的同时,还可以克服原图像中存在的局部亮度异常等问题。

    智能识别环境噪声类别的方法、系统及存储介质

    公开(公告)号:CN118471268B

    公开(公告)日:2024-10-18

    申请号:CN202410926523.2

    申请日:2024-07-11

    Inventor: 徐勇

    Abstract: 本发明公开了一种智能识别环境噪声类别的方法、系统及存储介质,包括:将环境噪声划分为多个环境噪声类别;针对各环境噪声类别,均采集一段声音文件,并人工打标噪声类别标签;对已打标噪声类别标签的各声音文件进行预处理,获取预处理后的若干声音片段;对预处理后的各声音片段进行特征提取,获取各声音片段特征;基于所述环境噪声类别和所述声音片段特征构建噪声类别识别模型;将各声音片段特征输入噪声类别识别模型进行模型训练,并利用训练后的所述噪声类别识别模型识别待识别声音片段的噪声类型及其对应的置信度。本发明完善了当前的环境噪声监测指标以及可为噪声治理提供依据。

Patent Agency Ranking