一种基于自注意力机制的环境噪声监测方法

    公开(公告)号:CN118866011B

    公开(公告)日:2025-02-07

    申请号:CN202411333837.8

    申请日:2024-09-24

    Inventor: 胡锐 徐勇

    Abstract: 本发明属于环境噪声监测技术领域,本发明公开了一种基于自注意力机制的环境噪声监测方法,包括以下步骤:通过短时傅里叶变换将音频信号转换为频谱图;通过自注意力机制提取频谱图的声纹特征;通过神经网络声纹特征对应到具体的环境声源类别,本发明通过利用短时傅里叶变换将音频信号转换为频谱图,并结合自注意力机制提取频谱图中的声纹特征,实现了对环境声音的多维度监测与分析。这种方法能够捕捉到声音的频率、能量分布、时间变化等丰富信息,为环境声监测提供更加全面和准确的指标,并且自注意力机制能够自动学习频谱图中的关键信息,并赋予其更高的权重,从而有效提取出对分类任务至关重要的声纹特征。

    一种具有图像类型适应性的超分辨率图像处理方法与系统

    公开(公告)号:CN111724303B

    公开(公告)日:2024-11-29

    申请号:CN202010398292.4

    申请日:2020-05-12

    Inventor: 徐勇

    Abstract: 本发明提供了一种具有图像类型适应性的超分辨率图像处理方法,包括以下步骤:S1、构建基于多类型图像的“通用”超分辨率模,将待处理图像作为基于多类型图像的“通用”超分辨率模的输入,运行基于多类型图像的“通用”超分辨率模型后,得出待处理图像的初步高分辨率图像;S2、构建基于单一类型图像的“精细”超分辨率模型,将初步高分辨率图像作为基于单一类型图像的“精细”超分辨率模型的输入,运行基于单一类型图像的“精细”超分辨率模型后,得出最终的高分辨率图像。本发明还提供了一种具有图像类型适应性的超分辨率图像处理系统。本发明的有益效果是:在提升图像分辨率的同时,还可以克服原图像中存在的局部亮度异常等问题。

    智能识别环境噪声类别的方法、系统及存储介质

    公开(公告)号:CN118471268B

    公开(公告)日:2024-10-18

    申请号:CN202410926523.2

    申请日:2024-07-11

    Inventor: 徐勇

    Abstract: 本发明公开了一种智能识别环境噪声类别的方法、系统及存储介质,包括:将环境噪声划分为多个环境噪声类别;针对各环境噪声类别,均采集一段声音文件,并人工打标噪声类别标签;对已打标噪声类别标签的各声音文件进行预处理,获取预处理后的若干声音片段;对预处理后的各声音片段进行特征提取,获取各声音片段特征;基于所述环境噪声类别和所述声音片段特征构建噪声类别识别模型;将各声音片段特征输入噪声类别识别模型进行模型训练,并利用训练后的所述噪声类别识别模型识别待识别声音片段的噪声类型及其对应的置信度。本发明完善了当前的环境噪声监测指标以及可为噪声治理提供依据。

    指向性视频对象分割方法、设备及计算机可读介质

    公开(公告)号:CN117789080A

    公开(公告)日:2024-03-29

    申请号:CN202311772954.X

    申请日:2023-12-21

    Inventor: 朱胤舟 徐勇

    Abstract: 本申请提供了一种指向性视频对象分割方法,包括基于短视频数据进行文本标注制作数据集;用所述数据集训练神经网络分割模型,所述神经网络分割模型包括时间编码器、空间编码器、解码器,在所述空间编码器和所述时间编码器的第s级后插入所述LBDT模块,所述LBDT模块的结果输入到所述解码器;将待预测视频数据输入到训练好的所述神经网络分割模型,得到对象分割结果。首创基于短视频制作数据集,并添加中文标注训练得到的包含改进LBDT模块的神经网络分割模型。可以至少用以解决现有指向性视频对象分割方法在特定语种下准确度不够高的技术问题。

    一种资源分配方法及装置
    7.
    发明公开

    公开(公告)号:CN117273330A

    公开(公告)日:2023-12-22

    申请号:CN202311201777.X

    申请日:2023-09-15

    Abstract: 本发明实施例提供了一种资源分配方法及装置,本申请提供了“采用启发式的、基于群智能的猫鼬群优化算法(Meerkat Swarm Intelligence Algorithm,MSIA)、拉格朗日松弛法和分支定价算法相结合的策略”的解决方案,具体为:获取城市水资源的基础参数;依据所述基础参数确定种群内资源的近似最优解;依据所述近似最优解确定种群内资源的全局最优解。本发明采用启发式的MSIA方法、拉格朗日松弛法和分支定价算法相结合的策略,通过模拟猫鼬捕猎的具体行为,设置启发式算法平衡探索阶段和利用阶段之间的平衡以及提升算法解的准确性,最后将全局最优解近似为算法所求的近似最优解。

    一种面向威廉斯综合症的面部图像分析系统

    公开(公告)号:CN119785403A

    公开(公告)日:2025-04-08

    申请号:CN202411879010.7

    申请日:2024-12-19

    Abstract: 本发明公开了一种面向威廉斯综合症的面部图像分析系统,包括:面部检测模块,用于识别并裁剪面部图像中的人脸区域,得到训练图像和测试图像;面部特征提取模块,用于根据训练图像,通过MobileFaceNet网络提取局部面部区域并重映射坐标值;其中局部面部区域包括:眼部区域、鼻子区域、嘴巴区域;逐像素加权模块,用于对训练图像的局部面部区域进行加权处理,得到加权图像;网络训练模块,用于通过VMamba网络对加权图像进行分类预测,得到训练好的VMamba网络;图像分析模块,用于将测试图像输入至训练好的VMamba网络,得到面向威廉斯综合症的面部图像分析结果。本发明能够准确分析具有威廉斯综合证的面孔图像。

    视频超分辨率方法、系统、电子设备及存储介质

    公开(公告)号:CN119205513A

    公开(公告)日:2024-12-27

    申请号:CN202411586232.X

    申请日:2024-11-08

    Inventor: 王鑫 徐勇

    Abstract: 本发明公开了一种视频超分辨率方法、系统、电子设备及存储介质,所述方法包括建立复杂运动场景下的视频超分辨率模型并训练和测试所述模型,模型包括特征提取子模块、跨帧对齐子模块、特征增强子模块和上采样重建子模块,特征提取子模块用于提取输入连续视频帧的浅层特征;跨帧对齐子模块利用可变形卷积对不同帧进行特征级对齐,实现跨帧的时空信息融合和运动补偿;特征增强子模块对特征进行增强;上采样重建子模块针对特征增强子模块输出的增强特征进行分辨率放大,并将分辨率放大后的增强特征重构为视频帧。本发明提高了复杂运动场景下视频的超分效果,增强视频的质量和视觉效果。

Patent Agency Ranking