一种基于强感知Transformer架构的缺损视频修复方法及系统

    公开(公告)号:CN118469876B

    公开(公告)日:2024-10-01

    申请号:CN202410912771.1

    申请日:2024-07-09

    Applicant: 华侨大学

    Abstract: 本发明公开了一种基于强感知Transformer架构的缺损视频修复方法及系统,涉及视频处理技术领域,方法包括以下步骤:特征提取模块接收待修复的缺损视频帧序列,采用卷积神经网络对视频帧进行特征提取,输出第一特征;强感知Transformer模块接收第一特征,采用交叉堆叠的局部感知Transformer和全局感知Transformer结构对第一特征进行纹理信息建模和结构信息建模,输出第二特征;重构模块接收第二特征,采用反卷积层进行视频帧重建,输出修复后视频帧序列。本发明采用交叉堆叠的局部感知Transformer和全局感知Transformer进行纹理信息和结构信息建模,有效解决现阶段缺损视频修复方法中存在修复区域缺乏细节纹理、全局结构与局部纹理不匹配的问题,实现更好的修复效果。

    基于感兴趣区域的VVC码率控制方法及装置

    公开(公告)号:CN118101938A

    公开(公告)日:2024-05-28

    申请号:CN202410497734.9

    申请日:2024-04-24

    Applicant: 华侨大学

    Abstract: 本发明公开了一种基于感兴趣区域的VVC码率控制方法及装置,涉及视频编码领域,方法包括:使用基于残差SSD网络训练的人脸检测模型检测图像中的人脸区域作为ROI;使用斯塔克尔伯格模型对ROI的失真进行建模,并采用二分法求解ROI的目标比特;计算编码图像的JND图作为空域视觉敏感度,对8x8互不重叠的子块进行运动估计,得到时域视觉敏感度;将有约束问题转化为无约束问题,并采用KKT条件进行最优化求解,得到最优拉格朗日乘子用于进行比特分配。本发明考虑视频会议、视频监控等应用对ROI的需求增长,人眼对ROI区域重点关注,提取空时域感知敏感度,对ROI和nROI的比特分配问题分别建模并进行最优化求解,合理进行比特分配。

    一种基于稀疏再聚焦的高分辨率人脸图像重建方法

    公开(公告)号:CN117671135A

    公开(公告)日:2024-03-08

    申请号:CN202311512308.X

    申请日:2023-11-14

    Applicant: 华侨大学

    Abstract: 本发明公开了一种基于稀疏再聚焦的高分辨率人脸图像重建方法,涉及图像处理技术领域,包括:利用卷积核为3×3的第一卷积层提取输入的低分辨率人脸图像的浅层特征;基于三个依次连接的组件特征提取网络提取组件特征;其中,第一个组件特征提取网络的输入与第一卷积层的输出相连接;基于三个依次连接的组件生成模块生成高分辨率组件图;其中,每个组件生成模块的输入与一个组件特征提取网络的输出相连接;利用逐像素相加合并高分辨率组件图,生成重建的高分辨率人脸图像。本发明能够有效抑制冗余特征并强调关键特征,实现高效的特征提取;根据图像组件的复杂度分而治之地重建组件并合并,能够降低高频细节的重建难度并复原高分辨率人脸图像。

    基于多模态融合的压缩视频质量增强方法及装置

    公开(公告)号:CN117237259A

    公开(公告)日:2023-12-15

    申请号:CN202311510614.X

    申请日:2023-11-14

    Applicant: 华侨大学

    Abstract: 本发明公开了一种基于多模态融合的压缩视频质量增强方法及装置,涉及图像处理领域,该方法包括:获取图像帧及其对应的光流图和纹理图并分别进行特征提取,得到图像特征、光流特征和纹理特征;构建压缩视频质量增强模型并训练,得到经训练的压缩视频质量增强模型;将图像特征、光流特征和纹理特征输入经训练的压缩视频质量增强模型,图像特征、光流特征和纹理特征输入多模态一致性单元,自适应调整三种模态信息的分布,得到第一特征、第二特征和第三特征并输入多模态融合单元以进行特征融合,得到融合特征并输入多模态重构单元,得到重构信息,将重构信息与图像帧相加,得到增强的视频帧,解决单模态图像难以有效改善最终重建视频的质量的问题。

    基于动态排序优化的图文检索深度神经网络模型训练方法

    公开(公告)号:CN117010458A

    公开(公告)日:2023-11-07

    申请号:CN202311287656.1

    申请日:2023-10-08

    Applicant: 华侨大学

    Abstract: 本发明公开了一种基于动态排序优化的图文检索深度神经网络模型训练方法,涉及信息检索技术领域,包括:构建深度神经网络用于图像与文本数据的深度特征提取;基于输入的图文实例对的标签与特征信息,计算实例间的标签层级相似度矩阵、特征层级相似度矩阵以及不同实例之间的亲和矩阵;通过构建融合语义相似度损失、排序损失以及哈希量化损失的综合损失函数,采用梯度下降优化算法缩小所述损失值,得到训练好的深度神经网络模型。本发明在模型训练过程中动态地调整梯度优化强度,提高了训练速度和精度,通过训练好的深度神经网络模型实现跨模态检索精度的提升。

    基于多池优先经验回放的强化学习网络训练方法及装置

    公开(公告)号:CN116796814A

    公开(公告)日:2023-09-22

    申请号:CN202310767100.6

    申请日:2023-06-27

    Applicant: 华侨大学

    Abstract: 本发明公开了一种基于多池优先经验回放的强化学习网络训练方法及装置,构建基于经验回放池和共享池的多池框架;将每个智能体对应的经验回放池中的样本按照采样概率采样至共享缓冲区中,将共享缓冲区中样本放入共享池中,将每个智能体从共享池中抽取的样本存放在各自的缓冲区中;在共享池中采用K‑means算法进行聚类,得到聚类结果,以对共享池中的样本进行清理;对强化学习网络分阶段进行训练,在不同的阶段智能体分别从其对应的经验回放池或者缓冲区中抽取样本进行学习,对经验回放池和共享池中样本的TD误差进行更新,并根据更新后的TD误差对共享池中的样本进行清理;重复交叉执行以上若干步骤,使智能体在环境异步环境下更好的探索最优策略。

    基于混合特征的无参考屏幕视频质量评价方法及系统

    公开(公告)号:CN114979709A

    公开(公告)日:2022-08-30

    申请号:CN202210726211.8

    申请日:2022-06-24

    Applicant: 华侨大学

    Abstract: 本发明公开一种基于混合特征的无参考屏幕视频质量评价方法及系统,包括:S10,将输入的失真屏幕视频SCV以连续30帧为一组,组合形成多个屏幕视频块SCVB;S20,计算每个屏幕视频块SCVB中每一帧视频帧对应的活动度,选取其中活动度最大的视频帧作为候选帧;S30,使用预训练好的卷积神经网络对所述屏幕视频块和候选帧进行特征提取,分别得到视频级特征和帧级特征;将视频级特征和帧级特征进行组合,形成用于表征视频的总体特征;S40,通过浅层卷积神经网络,将视频的总体特征映射成对应的质量分数。本发明充分利用了卷积神经网络在特征提取方面的优点,通过同时处理帧级和视频块级特征更加全面的提取了视频特征。

    基于双核化单类宽度学习自编码器的入侵信号检测方法

    公开(公告)号:CN120067773A

    公开(公告)日:2025-05-30

    申请号:CN202510535293.1

    申请日:2025-04-27

    Applicant: 华侨大学

    Abstract: 本发明公开了基于双核化单类宽度学习自编码器的入侵信号检测方法,涉及信号检测技术领域,方法包括:将接收的信号数据划分为训练集和测试集;使用核函数映射信号数据至特征层,并通过生成的随机矩阵重构数据以获得第一最优核函数矩阵;对特征层数据进行增强处理,得到第二最优核函数矩阵;串联重构的特征层与增强层形成隐藏层,计算其重构误差作为损失函数,求解得出输出层权重矩阵;基于训练集信号数据的重构损失设定判断阈值;结合第一和第二最优核函数矩阵、输出层权重矩阵及判断阈值,识别测试集中的入侵信号。本发明通过两次核函数映射及重构优化处理信号数据,提高了入侵信号检测的准确性。

Patent Agency Ranking