-
公开(公告)号:CN118196731A
公开(公告)日:2024-06-14
申请号:CN202410605567.5
申请日:2024-05-16
Applicant: 华侨大学 , 厦门松霖科技股份有限公司
Abstract: 本发明公开了一种基于通道与空间量子注意力学习的车辆再辨识方法及装置,涉及车辆再辨识领域,包括:利用深度网络从车辆图像中提取车辆的特征映射;设计通道量子注意力学习分支和空间量子注意力学习分支,分别对残差模块输出的特征映射学习通道量子注意力掩码和空间量子注意力掩码,并将两种注意力掩码融合为通道‑空间复合量子注意力掩码,用于增强车辆的特征映射,使深度网络能够更全面捕捉特征映射中的重要特征。本发明利用量子叠加与纠缠特性实现车辆注意力学习,能够提高特征学习效果,改善车辆再辨识的准确率,解决了传统机器学习模型难以学习这些复杂的非线性关系的问题。
-
公开(公告)号:CN113554084B
公开(公告)日:2024-03-01
申请号:CN202110806449.7
申请日:2021-07-16
Applicant: 华侨大学 , 厦门亿联网络技术股份有限公司 , 星宸科技股份有限公司
IPC: G06V10/80 , G06V10/82 , G06N3/0464 , G06N3/082
Abstract: 本发明实例公开了一种基于剪枝和轻量卷积的车辆再辨识模型压缩方法及系统,对待压缩的车辆再辨识模型的骨干网络进行预训练,对预训练完毕的骨干网络进行剪枝,并通过重训练恢复精度,对车辆再辨识模型中特征金字塔模块进行轻量化卷积设计,将紧凑的骨干网络与轻量化的特征金字塔模块结合,骨干网络提取特征后,特征金字塔模块进行特征融合,得到基于特征金字塔联合表示的轻量化车辆再辨识模型。本发明以复杂高性能的车辆再辨识模型作为输入模型,其骨干网络中重要性较低的卷积核被自动选择和剪枝,并改进其特征金字塔模块中的卷积方式,有效降低参数量和计算量,产生精度相当但较为紧凑的模型。
-
公开(公告)号:CN117196960A
公开(公告)日:2023-12-08
申请号:CN202311475299.1
申请日:2023-11-08
Applicant: 华侨大学
IPC: G06T3/40 , G06N3/0455 , G06N3/0464 , G06N3/08 , G06V10/80
Abstract: 本发明公开了一种全尺度特征细化轻量级图像超分辨率方法及装置,涉及图像处理领域,该方法包括:构建全尺度特征细化轻量级图像超分辨率模型并训练,得到经训练的全尺度特征细化轻量级图像超分辨率模型,将低分辨率图像输入经训练的全尺度特征细化轻量级图像超分辨率模型,先经过第一卷积层得到第一特征图,第一特征图经过串联的K个特征蒸馏提取模块,每一个特征蒸馏提取模块的输出均传送至第二卷积层,并经过第三卷积层,得到第二特征图,第二特征图与第一特征图相加,得到最终特征图,最终特征图输入上采样模块,重建得到高分辨率图像,解决原有超分辨率模型提取的特征信息过于单一的问题,通过蒸馏剔除冗余特征,使模型更加轻量化。
-
公开(公告)号:CN117196959A
公开(公告)日:2023-12-08
申请号:CN202311475294.9
申请日:2023-11-08
Applicant: 华侨大学
IPC: G06T3/40 , G06N3/0455 , G06N3/0464 , G06N3/08
Abstract: 本发明公开了一种基于自注意力的红外图像超分辨率方法、装置及可读介质,涉及图像处理领域,包括:构建基于自注意力的轻量级红外图像超分辨率模型并训练,得到经训练的轻量级红外图像超分辨率模型;将待重建的低分辨率红外图像输入经训练的轻量级红外图像超分辨率模型,该模型包括3×3卷积层、轻量级Transformer与CNN骨干、高效细节自注意力模块和图像重建模块,待重建的低分辨率红外图像输入3×3卷积层,得到第一特征,再依次经过轻量级Transformer与CNN骨干和高效细节自注意力模块,且高效细节自注意力模块以共享参数的方式循环n次,得到第二特征,将第一特征和第二特征进行残差连接后输入图像重建模块,输出高分辨率红外图像,解决参数量冗余、性能差等问题。
-
公开(公告)号:CN117036416A
公开(公告)日:2023-11-10
申请号:CN202311082425.7
申请日:2023-08-25
Applicant: 华侨大学
Abstract: 本发明公开了一种基于深层交互注意力机制的目标跟踪方法、装置及可读介质,该方法包括:获取视频序列,并分别从视频序列和第一帧中提取当前帧和模板帧;构建目标跟踪模型并训练,目标跟踪模型包括特征提取模块、Sim模块、判别定位模块和通道微调模块;将当前帧和模板帧输入经训练的目标跟踪模型,通过特征提取模块提取若干特征,将若干特征中的其中一个特征和模板帧输入Sim模块,得到前景特征图和前景概率特征图,将若干特征中的其中一个特征和模板帧输入判别定位模块,得到定位特征图,将前景特征图、前景概率特征图和定位特征图进行融合,得到混合特征图,将若干特征中的其余特征与混合特征图输入通道微调模块,得到目标跟踪结果,提高鲁棒性。
-
公开(公告)号:CN116405683A
公开(公告)日:2023-07-07
申请号:CN202310449794.9
申请日:2023-04-24
Applicant: 华侨大学
IPC: H04N19/147 , H04N19/176 , H04N19/149 , H04N19/11 , G06N3/0464 , G06N3/08
Abstract: 本发明公开了一种基于3D‑HEVC深度图模式预测的深度图编码方法、装置及可读介质,通过构建基于卷积网络的DMM模式预测模型并进行训练,得到经训练的DMM模式预测模型;将待编码深度图序列划分得到第一级别尺寸下的若干个当前待编码块,将当前待编码块输入经训练的DMM模式预测模型,输出的网络预测值为当前待编码块的编码过程中是否需要将DMM模式加入对应尺寸的全率失真代价计算列表的标签值;采用3D‑HEVC编码器对当前待编码块进行编码,在编码过程中调用网络预测值,并确定当前待编码块在对应尺寸下的最佳模式;以判断是否需要将DMM模式加入对应尺寸的全率失真代价计算列表,可避免直接将DMM模式加入全率失真代价计算列表,导致对DMM模式冗余的率失真计算过程。
-
公开(公告)号:CN115424168A
公开(公告)日:2022-12-02
申请号:CN202210975931.8
申请日:2022-08-15
Applicant: 华侨大学
Abstract: 本发明公开了一种基于自适应3D卷积的屏幕视频质量评价方法及装置,获取屏幕视频,基于局部视频活动度Γ(Px,y,t)对屏幕视频进行自适应分割,得到屏幕视频序列集合,屏幕视频包括参考屏幕视频和失真屏幕视频,屏幕视频序列集合包括参考屏幕视频序列集合和失真屏幕视频序列集合;通过3D卷积神经网络分别提取参考屏幕视频序列集合的参考时空卷积特征STr以及失真屏幕视频序列集合的失真时空卷积特征STd;采用双尺度卷积神经网络对参考时空卷积特征STr和失真时空卷积特征STd实现双通道时空特征融合,计算得到失真屏幕视频的质量评价分数。着重于考虑人眼视觉系统特性及屏幕视频本质信息,模拟人类视觉系统的多通道视觉处理过程,从不同角度实现对失真屏幕视频的质量预测。
-
公开(公告)号:CN111510721B
公开(公告)日:2022-11-01
申请号:CN202010278978.X
申请日:2020-04-10
Applicant: 华侨大学
IPC: H04N19/39 , H04N19/132 , H04N19/59 , H04N19/124 , H04N19/61
Abstract: 本发明提供了一种基于空间下采样的多描述编码高质量边重建方法,包括,制作数据集:选取视频,通过空间下采样分成两个描述,在量化参数QP值设定下,编码,解码,将解码后的视频和相应的原始视频作为训练集;训练SD‑VSRnet网络:每五帧视频作为网络的输入,依次进行特征提取,恢复高频细节,像素重排,再与输入的中间帧进行跳跃连接得到重建的视频帧,逐帧重建获得最后的重建视频,实现SD‑VSRnet网络的训练。本发明提出的方法制作了适用于空间下采样的多描述编码高质量边重建的数据集,另外,采用视频超分辨率的神经网络,分别测试4种QP值,可以有效提高不同压缩程度的边缘解码视频重建质量。
-
公开(公告)号:CN114710667A
公开(公告)日:2022-07-05
申请号:CN202210269314.6
申请日:2022-03-18
Applicant: 华侨大学
IPC: H04N19/107 , H04N19/11 , H04N19/96
Abstract: 本发明公开了一种针对H.266/VVC屏幕内容帧内CU划分的快速预测方法及装置,通过收集屏幕内容视频建立数据库,用于训练模型;构建宽度自适应网络模型,预测两种不同尺寸CU的划分方式,预测步骤如下:先采用网络模型对64×64大小的CU进行划分方式预测,若为不划分,则停止CU的RD代价计算,若为划分,则得到4个32×32大小的CU,则采用网络模型对32×32大小的CU的划分方式进行预测,若为不划分,则停止RD的代价计算,若为四叉树划分,则得到4个16×16的CU:若为多种类型叉树划分,则需要依靠标准编码器进行计算;最后设定适当的预设阈值来提高预测准确率。本发明能够在保持H.266/VVC编码效率的前提下,有效地降低H.266/VVC屏幕内容的帧内预测编码计算复杂度。
-
公开(公告)号:CN109166160B
公开(公告)日:2022-07-01
申请号:CN201811082243.9
申请日:2018-09-17
Applicant: 华侨大学
IPC: G06T9/00
Abstract: 本发明公开了一种采用图形预测的三维点云压缩方法,属于视频编码领域,方法包括:采用KD树对输入三维点云进行自适应分块;采用KNN算法计算编码单元内每个点的K邻近点;构建每个单元块的图并计算图形平移算子;对每个编码单元的块进行去均值,采用K‑means算法对编码单元进行自适应采样,通过求解优化问题对未采样点进行预测;利用基于KD树的块均值预测算法对每个编码单元块的均值进行预测编码;最后用算术编码器对所有量化的参数和残差进行熵编码。本发明采用图形预测,能够对庞大的三维点云数据进行有效压缩,极大地改善三维点云的传输和存储效率。
-
-
-
-
-
-
-
-
-