-
公开(公告)号:CN116778446A
公开(公告)日:2023-09-19
申请号:CN202310761995.2
申请日:2023-06-26
Applicant: 华侨大学
IPC: G06V20/56 , G06N3/0464 , G06V10/82 , G06N3/048 , G06V10/22 , G06V10/764 , G06V10/26 , G06V10/74 , G06N3/08
Abstract: 本发明公开了一种车道线快速检测方法、装置及可读介质,获取路况图像;构建基于编码器‑解码器的神经网络并训练,得到车道线检测模型,基于编码器‑解码器的神经网络包括主干分支和辅助分支,主干分支包括依次连接的编码器网络、CBAM注意力机制模块和解码器网络,编码器网络中包括改进的残差结构,改进的残差结构包括第一卷积层以及分别与第一卷积层连接的第一分支和第二分支,第一分支包括第二卷积层,第二分支包括依次连接的第三卷积层和第四卷积层,第一分支、第二分支与第一卷积层的输入通过加法器相连,辅助分支为实例分割网络,并仅在训练过程中使用;将路况图像输入车道线检测模型,检测得到车道线图像,提高车道线检测的准确率和检测速度。
-
公开(公告)号:CN116757977A
公开(公告)日:2023-09-15
申请号:CN202310502926.X
申请日:2023-05-06
Applicant: 华侨大学
IPC: G06T5/50 , G06T7/246 , G06N3/0464 , G06N3/08
Abstract: 本发明公开了一种基于多尺度双向卷积的压缩视频感官质量增强方法及系统,包括:将输入的多个视频帧进行运动补偿,获得对齐后的特征;所述输入的多个视频帧包括参考帧和参考帧的前后若干相邻帧;提取对齐后的特征的时序信息,获得时空融合后的特征;提取时空融合后的特征的方向特征,获得水平特征和垂直特征;基于参考帧和相邻帧来指导水平特征和垂直特征的恢复,获得细节注意力机制处理后的特征;将通过细节注意力机制处理后的特征进行增强,获得增强后的方向特征;将增强后的方向特征与参考帧进行逐元素相加,得到增强帧。本发明能够提高重建视频帧的感官质量,恢复的重建帧更符合人类视觉系统,能够改善压缩带来的质量下降问题。
-
公开(公告)号:CN116740143A
公开(公告)日:2023-09-12
申请号:CN202310744027.0
申请日:2023-06-21
Applicant: 华侨大学
IPC: G06T7/246 , G06T7/73 , G06V10/82 , G06V10/764 , G06V10/766 , G06V10/74
Abstract: 本发明提供一种联合轨迹损失和排名损失优化的鲁棒目标跟踪器,包括:步骤S1、用非权重共享的孪生骨干网络提取特征,得到模板特征图和历史特征图;步骤S2、利用模板特征图和历史特征图获得目标相似性响应图;步骤S3、利用轨迹损失学习使跟踪器学习目标的运动信息;步骤S4、利用IOU引导的排名损失优化跟踪器的分类子网络和回归子网络;步骤S5、联合轨迹损失和IOU引导的排名损失实现目标状态的估计。本发明能够提升孪生跟踪器的准确性和鲁棒性。
-
公开(公告)号:CN116668723A
公开(公告)日:2023-08-29
申请号:CN202310550087.9
申请日:2023-05-16
Applicant: 华侨大学
IPC: H04N19/597 , H04N19/593 , H04N19/124 , H04N19/119 , H04N19/61 , G06T9/00 , G06N3/0464
Abstract: 本发明公开了一种基于卷积神经网络的3D‑HEVC深度图帧内编码单元划分方法及装置,通过构建编码单元划分预测模型并训练,采用3D‑HEVC编码器对当前待编码块进行编码,在编码过程中确定编码单元的当前尺寸和当前编码量化参数;根据编码单元的当前尺寸和/或当前编码量化参数确定在编码过程中采用速度模式或性能模式,在速度模式中,将预测值作为当前待编码块的划分结果;在性能模式中,使用3D‑HEVC编码器预测当前待编码块的划分结果;判断编码单元的当前尺寸是否大于第四尺寸,若是则调整当前待编码块的尺寸缩小一个级别,并重复以上步骤,直至得到当前待编码块的所有划分结果,本方法在保证一定编码质量的前提下,能够显著节省深度图编码所需时间。
-
-
公开(公告)号:CN116109880A
公开(公告)日:2023-05-12
申请号:CN202310088624.2
申请日:2023-02-09
Applicant: 华侨大学 , 厦门亿联网络技术股份有限公司
Abstract: 本发明提供一种鬼影方位视觉注意力学习方法。现有方位视觉注意力学习方法依赖卷积运算进行维度变换以及方位信息学习,计算和参数代价都较高。为此,本发明将轻量的鬼影模块耦合到方位视觉注意力学习方法中,设计降维鬼影模块轻量化压缩特征映射图,随后进行方位信息学习以节约计算和参数代价;设计去冗余鬼影模块降低特征映射图中的冗余信息,能改善特征质量。本发明作为一种新颖的视觉注意力机制有广泛应用,例如图像目标检测、图像目标识别、图像分割等。
-
公开(公告)号:CN111160226B
公开(公告)日:2023-03-31
申请号:CN201911370041.9
申请日:2019-12-26
Applicant: 华侨大学
IPC: G06V40/10 , G06V10/764 , G06V10/82 , G06V10/77 , G06N3/0464 , G06N3/048 , G06N3/084
Abstract: 本发明涉及一种基于视角自适应特征学习的行人性别识别方法包括:视角自适应训练过程,性别识别过程。本发明利用输入行人的视角信息来指导卷积神经网络的特征学习过程,以减轻行人视角变化对神经网络进行性别识别的影响,使训练得到的网络模型具有更加准确的行人性别识别效果。本发明结合了行人的视角信息,解决了以往基于卷积神经网络用在行人性别识别问题上的不足,有效地提高了行人性别识别精度。本发明可以被广泛地应用在智能视频监控场景,例如大型商场,机场,火车站等。
-
公开(公告)号:CN111524104B
公开(公告)日:2023-03-24
申请号:CN202010285704.3
申请日:2020-04-13
Applicant: 华侨大学
Abstract: 本发明涉及一种基于多尺度轮廓波特征的全参考光场图像质量评价方法,基于光场图像表面的轮廓和曲线具有感知相关性,通过具有良好各向异性的多尺度多方向轮廓波变换有效地捕捉光场图像中场景结构变化的边缘和轮廓细节,充分考虑了人眼视觉系统对于光场图像的主观感知度,具有较好的光场图像质量评价性能。本发明的实施,能够得到匹配于人眼视觉的主观感知度的评价结果。
-
公开(公告)号:CN115567712A
公开(公告)日:2023-01-03
申请号:CN202211156529.3
申请日:2022-09-22
Applicant: 华侨大学
IPC: H04N19/147 , H04N19/149 , H04N19/177
Abstract: 本发明公开了一种基于人眼恰可察觉失真的屏幕内容视频编码感知码率控制方法及装置,属于视频编码领域。首先获取屏幕内容视频,对屏幕内容视频进行边缘建模,得到二维边缘模型,提取二维边缘模型的边缘特征,并计算得到二维边缘模型的边缘模型参数;基于边缘模型参数获取亮度自适应阈值、对比度掩蔽效应阈值、边缘非结构失真敏感度阈值以及结构失真敏感度阈值,构建屏幕内容视频的像素域JND模型,确定JND因子;然后利用边缘特征和JND因子指导感知复杂度分类和目标比特分配;最后通过参考视频帧和重建视频帧的边缘相似度构建在JND约束条件下的感知码率控制模型。该方法能够提高屏幕内容视频的码率控制精度,明显改善屏幕内容视频的编码率失真性能。
-
公开(公告)号:CN111526371B
公开(公告)日:2022-12-06
申请号:CN202010366824.6
申请日:2020-04-30
Applicant: 华侨大学
IPC: H04N19/593 , H04N19/117 , H04N19/146 , H04N19/14
Abstract: 本发明涉及一种基于Gabor特征和灰度共生矩阵的视频帧内编码快速算法,属于视频编码领域。本方法利用灰度共生矩阵非零值个数与编码树单元(Coding Tree Unit,CTU)分割深度的关系,设定阈值预判编码模块的分割深度,得到不同阈值对应的深度区间;然后对深度范围内的编码单元(Coding Unit,CU)利用Gabor特征进行分类,并进行平坦块和复杂块的划分,最后根据不同的CU类型选择不同编码方案。本发明一种基于Gabor特征和灰度共生矩阵的屏幕内容视频帧内编码快速算法能够减少编码器计算开销,在保持视频质量基本不变的情况下,减少编码时间。
-
-
-
-
-
-
-
-
-