-
公开(公告)号:CN116596764B
公开(公告)日:2023-10-31
申请号:CN202310871402.8
申请日:2023-07-17
Applicant: 华侨大学
IPC: G06T3/40 , G06N3/0455 , G06N3/0464 , G06N3/08 , G06V10/42 , G06V10/44
Abstract: 本发明涉及图像处理技术领域,公开了一种基于Transformer与卷积交互的轻量级图像超分辨率方法,包括以下步骤:S1,构建跨通道Transformer模块与高效局部特征提取模块;S2,构建反转U型网络模块;S3,构建全局特征提炼模块;S4,将反转U型网络模块与全局特征提炼模块组合起来,构建基于Transformer与卷积交互的轻量级超分辨率网络;网络输入低分辨率图像,输出高分辨率的重建图像。本发明使用较少参数与计算量,同时拥有更优的重建效果;通过Transformer与卷积的交互,兼顾图像的全局与局部细节;反转U型网络模块先在编码器阶段将关键信息转移至特征图维度上,再在解码器阶段将关键信息返回至通道维度中,以实现低资源耗费来融合多阶段信息的目的。
-
公开(公告)号:CN116740142A
公开(公告)日:2023-09-12
申请号:CN202310741844.0
申请日:2023-06-21
Applicant: 华侨大学
Abstract: 本发明公开了一种轨迹注意力目标跟踪方法、装置及可读介质,通过特征提取网络分别对历史帧及其前景‑背景掩膜图和查询帧进行特征提取,得到历史特征图、前景‑背景掩膜特征图和查询特征图;空间注意力模块用于结合历史特征图、前景‑背景掩膜特征图和查询特征图匹配目标特征,并利用目标聚焦策略建立空间依赖关系,得到附有空间权重的历史特征图,时序注意力模块用于对时序交互后的时序响应图进行时序信息交互,得到时序交互后的时序响应图,通道融合模块用于对时序交互后的时序响应图与查询特征图进行融合,得到目标响应图;将目标响应图输入头网络预测得到目标的位置和边界框。本发明可避免空间冗余信息的干扰,有效提升辨别能力。
-
公开(公告)号:CN116721091A
公开(公告)日:2023-09-08
申请号:CN202310744289.7
申请日:2023-06-21
Applicant: 华侨大学
Abstract: 本发明公开了一种布匹瑕疵检测方法、装置及可读介质,通过获取待检测的布匹图像和模板图像;构建改进的Yolov5s网络并训练,得到布匹瑕疵检测模型,改进的Yolov5s网络包括主干特征提取网络、颈部特征融合网络和头部预测网络,主干特征提取网络采用CSPDarkNet,颈部特征融合网络包括特征过滤金字塔网络和融合卷积块注意力模块的路径聚合网络,在训练过程中采用多类聚焦置信度损失函数代替交叉熵置信度损失函数;将待检测的布匹图像和模板图像输入布匹瑕疵检测模型,得到布匹检测结果。该方法关注实际布匹瑕疵检测中存在的瑕疵种类分布不均、不同瑕疵的检测难易程度不同等问题,通过对冗余背景特征的过滤与关键前景特征的提纯,降低网络复杂度,提高检测精度和效率。
-
公开(公告)号:CN116596764A
公开(公告)日:2023-08-15
申请号:CN202310871402.8
申请日:2023-07-17
Applicant: 华侨大学
IPC: G06T3/40 , G06N3/0455 , G06N3/0464 , G06N3/08 , G06V10/42 , G06V10/44
Abstract: 本发明涉及图像处理技术领域,公开了一种基于Transformer与卷积交互的轻量级图像超分辨率方法,包括以下步骤:S1,构建跨通道Transformer模块与高效局部特征提取模块;S2,构建反转U型网络模块;S3,构建全局特征提炼模块;S4,将反转U型网络模块与全局特征提炼模块组合起来,构建基于Transformer与卷积交互的轻量级超分辨率网络;网络输入低分辨率图像,输出高分辨率的重建图像。本发明使用较少参数与计算量,同时拥有更优的重建效果;通过Transformer与卷积的交互,兼顾图像的全局与局部细节;反转U型网络模块先在编码器阶段将关键信息转移至特征图维度上,再在解码器阶段将关键信息返回至通道维度中,以实现低资源耗费来融合多阶段信息的目的。
-
公开(公告)号:CN110072113B
公开(公告)日:2023-03-10
申请号:CN201910414604.3
申请日:2019-05-17
Applicant: 华侨大学
IPC: H04N19/597 , H04N19/109 , H04N19/503 , H04N13/161
Abstract: 本发明涉及一种基于贝叶斯决策的3D‑HEVC深度图帧间快速算法,属于视频编码领域,本方法包括CU尺寸判决和模式快速选择。首先,提取当前CU划分或者不划分时,遍历完DIS模式的RDcost作为特征,通过离线训练高斯模型,并且计算损失函数,将后验概率与损失函数作比较,判断当前CU是否为最佳尺寸;其次,提取最优模式是否是SKIP或者DIS时,遍历完SKIP或者DIS的RDcost作为特征,引入全零块,通过最小错误贝叶斯判决,判断当前最优模式是否是SKIP或者DIS。本发明一种基于贝叶斯决策的3D‑HEVC深度图帧间快速算法能够减少编码器计算开销,在保持编码性能基本不变的情况下,减少编码时间。
-
公开(公告)号:CN115396667A
公开(公告)日:2022-11-25
申请号:CN202211005433.7
申请日:2022-08-22
Applicant: 华侨大学
IPC: H04N19/124 , H04N19/154 , H04N19/70 , H04N19/82
Abstract: 本发明涉及一种基于可变形卷积的宽QP范围环路滤波方法,属于视频编码领域。本方法利用可变形卷积灵活的感受野与形变建模能力,自动学习视频特征,并通过密集残差连接,进行特征强化,以达到增强压缩视频质量的目的;同时提出一种QP注意力模块,提高该方法的泛化能力,使该方法能够同时提升不同QP下的压缩视频质量。本发明方法能够显著提升压缩视频的主客观质量。
-
公开(公告)号:CN113038126B
公开(公告)日:2022-11-01
申请号:CN202110261181.3
申请日:2021-03-10
Applicant: 华侨大学
IPC: H04N19/122 , H04N19/124 , H04N19/13 , H04N19/184 , H04N19/42 , H04N19/625 , G06N3/04 , H04N7/01
Abstract: 基于帧预测神经网络的多描述视频编码方法和解码方法,本发明在编码端将源视频采用时间下采样的方法分为奇数帧和偶数帧,分别将奇数帧和偶数帧组成两个新的序列,通过HEVC编码器进行编码。针对时间下采样所导致的帧丢失问题,采用帧预测神经网络来分别预测对应序列中所丢失的帧。将预测帧与对应序列的已编码视频帧相减获得残差信息,与当前序列已编码信息组成一个描述。将两个描述的码流打包分别通过不同的信道传输到解码端。本发明方法构成的多描述视频编码使码流具有一定的差错恢复能力,解码端可充分利用描述间的相关信息保证解码端在不可靠网络传输下的高质量视频重建。
-
公开(公告)号:CN113014916B
公开(公告)日:2022-11-01
申请号:CN202110219595.X
申请日:2021-02-26
Applicant: 华侨大学
IPC: H04N17/00
Abstract: 本发明公开了一种基于局部视频活动度的屏幕视频质量识别方法,方法包括:分别对参考和失真屏幕视频序列采用3D‑LOG滤波器提取屏幕特征;计算屏幕区域相似度,基于3D‑LOG池化策略得到屏幕质量分数;分别对参考和失真屏幕视频序列采用3D‑NSS方法提取自然特征;计算自然区域相似度,基于池化策略得到自然质量分数;计算局部视频活动度;基于局部视频活动度结合屏幕和自然质量分数获得最终失真屏幕视频质量评价值。本发明充分考虑到人类视觉系统对于屏幕视频的屏幕和自然内容区域感知度不同且人眼对于边缘特征高度敏感,具有较好的失真屏幕视频质量评价性能。
-
公开(公告)号:CN109801273B
公开(公告)日:2022-11-01
申请号:CN201910016167.X
申请日:2019-01-08
Applicant: 华侨大学
Abstract: 本发明涉及一种基于极平面线性相似度的光场图像质量评价方法,属于图像处理领域,根据人类视觉系统理解光场图像时对场景结构变化的敏感性和光场图像中包含丰富的场景结构变化信息提出,方法包括:对参考光场图像和失真光场图像分别提取极平面图;接着分别提取参考极平面图和失真极平面图的线性特征图,进而计算得到极平面线性特征相似度图;基于极平面线性相似度图得到最终失真光场图像质量评价值。本发明充分利用极平面线性特征来描述光场图像中场景结构变化,从而评价失真光场图像的质量,反映人眼主观视觉系统对于光场图像的主观感知度,具有较好的光场图像质量评价性能。
-
公开(公告)号:CN110399886B
公开(公告)日:2022-09-30
申请号:CN201910635863.9
申请日:2019-07-15
Applicant: 华侨大学
Abstract: 本发明涉及一种屏幕图像JND模型构建方法。首先利用文本分割技术得到屏幕图像的文本区域;其次提取文本区域的边缘像素,将屏幕图像分为文本边缘区域和非文本边缘区域;然后利用边缘宽度和边缘对比度计算出边缘结构失真敏感度和边缘对比度掩蔽,得到文本边缘区域视觉掩蔽模型;接着计算出非文本边缘区域的亮度自适应和对比度掩蔽效应,得到非文本边缘区域视觉掩蔽模型;最后结合文本边缘区域和非文本边缘区域的视觉掩蔽模型得到屏幕图像JND模型。本发明充分考虑屏幕图像特点以及人眼对屏幕图像不同区域具有不同的视觉感知特性等因素,对屏幕图像的视觉冗余信息有较为准确的估计,可广泛地应用到屏幕图像技术领域。
-
-
-
-
-
-
-
-
-