基于灵活时空区域划分的注意力视频去雾方法

    公开(公告)号:CN119515727A

    公开(公告)日:2025-02-25

    申请号:CN202411573684.4

    申请日:2024-11-06

    Applicant: 四川大学

    Abstract: 本发明提出了一种基于灵活时空区域划分的注意力视频去雾方法,该方法采用时空注意力的方式提取雾霾视频帧中的时空关联特征,以加强视频去雾算法面对非均匀雾霾和大范围运动场景时的去雾效果。所提出的方法使用滑动窗口关联注意力模块来提取空间上相互作用的雾霾密度信息,以解决不同区域之间雾霾密度变化的难题。此外,所提出的基于灵活时空区域划分的注意力视频去雾方法使用了一个时间互补信息增强模块来捕获参考帧与相邻帧间的互补信息,以解决视频帧之间时间变化的问题,减少帧间伪影。

    基于风格卷积的双掩码特征注意人脸图像去模糊方法

    公开(公告)号:CN117274611A

    公开(公告)日:2023-12-22

    申请号:CN202311437114.8

    申请日:2023-11-01

    Applicant: 四川大学

    Abstract: 本发明提出了一种基于风格卷积的双掩码特征注意人脸图像去模糊方法,采用风格卷积网络并结合双掩码注意力机制有效去除人脸图像模糊,恢复人脸图像细节。所提出的多尺度特征注意提取编码器提取模糊人脸图像中不同尺度的身份特征信息,保证提取特征与模糊人脸图像的身份一致性。所提出的风格卷积双掩码生成器解析出特征中对应的皮肤语义掩码和五官语义掩码,同时得到相应的去模糊特征。所提出的双掩码特征注意自适应融合解码器,通过注意力机制提取模糊人脸图像中掩码区域特征,与去模糊特征自适应融合,增强去模糊人脸图像细节。因此,所提出的方法可以在单幅模糊人脸图像的输入下,将其恢复为清晰人脸图像,以便提高人脸识别等任务的性能表现。

    基于多任务自动编码变换的低光特征检测和描述方法

    公开(公告)号:CN119090970A

    公开(公告)日:2024-12-06

    申请号:CN202311208627.1

    申请日:2023-09-19

    Applicant: 四川大学

    Abstract: 本发明提出了一种基于多任务自动编码变换的低光特征检测和描述方法,该方法采用多任务自动编码变换机制将特征增强和特征提取耦合,以加强极端低光环境下特征检测和描述能力。所提出的方法利用低光退化参数预测解码器预测低光退化变换的同时促进编码器在正常光图像和暗光图像之间提取共同鲁棒的特征信息。所提出的全局描述子相似性可以减少特征信息中噪声和低光退化因素的影响,以提高低光环境下特征检测解码器的局部描述子的匹配性能。此外,所提出的多任务正交化约束使得梯度正则化以避免三种下游任务在特征提取时互相干扰。因此,所提出的方法可以在极端低光环境下有效地特征检测和描述,以便后续位姿估计获得更精确的结果。

    一种基于关注阴影边界和特征校正的阴影检测方法及设备

    公开(公告)号:CN115546171A

    公开(公告)日:2022-12-30

    申请号:CN202211272515.8

    申请日:2022-10-18

    Applicant: 四川大学

    Abstract: 本发明公开了一种基于关注阴影边界和特征校正的阴影检测方法及设备,属于深度学习与图像阴影检测技术领域。包括:获取数据集,将所述数据集划分为训练集和测试集;构建阴影检测神经网络模型,输入训练集对阴影检测神经网络模型进行训练,并输出训练好的阴影检测神经网络模型;将测试集输入到训练好的阴影检测神经网络模型中,输出阴影预测结果,通过阴影检测神经网络模型中设置的特征校正模块感知和学习阴影区域存在的漏检测特征和误检测特征特征,大幅度降低了阴影误检测和漏检测现象的发生,进一步的提升了阴影检测性能。

    基于时空和运动深度学习的驾驶员行为识别方法及设备

    公开(公告)号:CN115482519A

    公开(公告)日:2022-12-16

    申请号:CN202211152378.4

    申请日:2022-09-21

    Applicant: 四川大学

    Abstract: 本发明公开了一种基于时空和运动深度学习的驾驶员行为识别方法及设备,属于智能交通技术领域和计算机视觉领域,包括获取驾驶员行为视频段,并将视频段划分为训练集和测试集;对训练集和测试集的视频段进行帧采样,获得视频帧,并对视频帧进行图像增强;并基于训练集中进行图像增强后的视频帧训练得到基于时空和运动特征深度学习的驾驶员行为识别网络;将测试集中进行图像增强后的视频帧输入到训练好的驾驶员行为识别网络中,并输出驾驶行为识别结果,通过扩展时空维度的等效感受野有效地提取全局时空特征,并且联合激发原始特征的运动模式和显著时空特征,迫使网络关注视频中最具判别力的特征,提升了驾驶行为的识别准确率。

    基于语音文本图像进行特征提取与模态融合的多模态情感识别方法

    公开(公告)号:CN119691678A

    公开(公告)日:2025-03-25

    申请号:CN202411776783.2

    申请日:2024-12-05

    Applicant: 四川大学

    Abstract: 本发明提出了一种基于语音文本图像进行特征提取与模态融合的多模态情感识别方法。我们设计了一个3模态特征提取器来准确捕获原始视频中所包含的语音、文本和图像特征,并引入跨模态注意力机制对不同模态提取出的特征序列进行融合。为应对不同模态特征序列融合时缺乏控制的问题,我们在模型中引入了模态互补控制门结构。同时,在跨模态注意力机制中我们通过引入卷积层引导模型关注不同模态的局部特征。在中文多模态情感识别数据集CH‑SIMSv2.0上的实验证明了本发明所提出网络的有效性。

    基于风格特征注入的图像生成方法

    公开(公告)号:CN119648517A

    公开(公告)日:2025-03-18

    申请号:CN202411856382.8

    申请日:2024-12-17

    Applicant: 四川大学

    Abstract: 本发明提出了一种基于风格特征注入的图像生成方法,能够在文生图的基础上高效地迁移风格参考图的空间布局和颜色纹理。所提出的方法在StableDiffusion文生图的基础上,利用Dreambooth绑定特征的能力学习图像的空间布局和初步风格,再执行注意力注入以强化颜色特征和细节纹理。因此,所提出的方法在各种风格上具有很高的泛化性,对于单一特定风格,无需进行繁琐调参,对构图、纹理、颜色等上下文特征高度敏感。另外,模型对数据需求量少,仅需3‑5张训练图像,推理过程中注意力参考图仅需一张,且无需进行额外的训练,具有很强的鲁棒性。因此,所提出的风格图像生成方法可以适应多种不同的风格,以便在个性化任务中具有更高的自由度。

    一种基于生成对抗网络的两步式单幅图像去雨方法

    公开(公告)号:CN117474783A

    公开(公告)日:2024-01-30

    申请号:CN202311544463.X

    申请日:2023-11-20

    Applicant: 四川大学

    Abstract: 本发明公开了一种基于生成对抗网络的两步式单幅图像去雨方法。该方法首先构建了一个雨水生成网络,使用合成雨图和真实雨图作为输入和目标,训练生成器生成一个雨水图像,同时训练一个判别器捕捉雨水掩膜,通过对比真实雨水和合成雨水的分布差异,促使生成器生成更加贴近真实雨水分布的图像,交替训练生成器与判别器直至达到预设条件;然后通过生成器在原有数据集的基础上生成多张雨水图像对,完成数据集扩充,将扩充后的数据集送入去雨网络,同时利用判别器捕捉到的雨水掩膜对去雨网络进行指导,提升去雨网络的泛化能力和去雨效果。

    一种针对低光照图像的增强方法
    10.
    发明公开

    公开(公告)号:CN115937031A

    公开(公告)日:2023-04-07

    申请号:CN202211625075.X

    申请日:2022-12-16

    Applicant: 四川大学

    Abstract: 本发明涉及图像处理技术领域,且公开了一种针对低光照图像的增强方法,包括以下步骤:S1、首先对低照度图像的R、G、B三种分量分别用改进的同态滤波算法进行增强,提高图像对比度;S2、然后将图像从RGB颜色空间转换到HSV颜色空间;S3、用改进的多尺度Retinex算法对亮度进行增强处理,对照射分量用伽马变换进行校正。该针对低光照图像的增强方法,将图像从RGB色彩空间转换至HSV色彩空间,很好的保持了图像的色彩信息;而进行同态滤波处理,能对图像的光照进行校正;对入射分量的伽马校正,可以对图像进行非线性色调编辑,提高图像的对比度;对反射分量的双边滤波,既可以去除图像的噪声又可以保持图像的边缘信息;Sigmoid函数达到进一步增强图像的目的。

Patent Agency Ranking