一种车道线快速检测方法、装置及可读介质

    公开(公告)号:CN116778446A

    公开(公告)日:2023-09-19

    申请号:CN202310761995.2

    申请日:2023-06-26

    Applicant: 华侨大学

    Abstract: 本发明公开了一种车道线快速检测方法、装置及可读介质,获取路况图像;构建基于编码器‑解码器的神经网络并训练,得到车道线检测模型,基于编码器‑解码器的神经网络包括主干分支和辅助分支,主干分支包括依次连接的编码器网络、CBAM注意力机制模块和解码器网络,编码器网络中包括改进的残差结构,改进的残差结构包括第一卷积层以及分别与第一卷积层连接的第一分支和第二分支,第一分支包括第二卷积层,第二分支包括依次连接的第三卷积层和第四卷积层,第一分支、第二分支与第一卷积层的输入通过加法器相连,辅助分支为实例分割网络,并仅在训练过程中使用;将路况图像输入车道线检测模型,检测得到车道线图像,提高车道线检测的准确率和检测速度。

    基于多尺度双向卷积的压缩视频感官质量增强方法及系统

    公开(公告)号:CN116757977A

    公开(公告)日:2023-09-15

    申请号:CN202310502926.X

    申请日:2023-05-06

    Applicant: 华侨大学

    Abstract: 本发明公开了一种基于多尺度双向卷积的压缩视频感官质量增强方法及系统,包括:将输入的多个视频帧进行运动补偿,获得对齐后的特征;所述输入的多个视频帧包括参考帧和参考帧的前后若干相邻帧;提取对齐后的特征的时序信息,获得时空融合后的特征;提取时空融合后的特征的方向特征,获得水平特征和垂直特征;基于参考帧和相邻帧来指导水平特征和垂直特征的恢复,获得细节注意力机制处理后的特征;将通过细节注意力机制处理后的特征进行增强,获得增强后的方向特征;将增强后的方向特征与参考帧进行逐元素相加,得到增强帧。本发明能够提高重建视频帧的感官质量,恢复的重建帧更符合人类视觉系统,能够改善压缩带来的质量下降问题。

    基于卷积神经网络的3D-HEVC深度图帧内编码单元划分方法及装置

    公开(公告)号:CN116668723A

    公开(公告)日:2023-08-29

    申请号:CN202310550087.9

    申请日:2023-05-16

    Applicant: 华侨大学

    Abstract: 本发明公开了一种基于卷积神经网络的3D‑HEVC深度图帧内编码单元划分方法及装置,通过构建编码单元划分预测模型并训练,采用3D‑HEVC编码器对当前待编码块进行编码,在编码过程中确定编码单元的当前尺寸和当前编码量化参数;根据编码单元的当前尺寸和/或当前编码量化参数确定在编码过程中采用速度模式或性能模式,在速度模式中,将预测值作为当前待编码块的划分结果;在性能模式中,使用3D‑HEVC编码器预测当前待编码块的划分结果;判断编码单元的当前尺寸是否大于第四尺寸,若是则调整当前待编码块的尺寸缩小一个级别,并重复以上步骤,直至得到当前待编码块的所有划分结果,本方法在保证一定编码质量的前提下,能够显著节省深度图编码所需时间。

    基于多尺度轮廓波特征的全参考光场图像质量评价方法

    公开(公告)号:CN111524104B

    公开(公告)日:2023-03-24

    申请号:CN202010285704.3

    申请日:2020-04-13

    Applicant: 华侨大学

    Abstract: 本发明涉及一种基于多尺度轮廓波特征的全参考光场图像质量评价方法,基于光场图像表面的轮廓和曲线具有感知相关性,通过具有良好各向异性的多尺度多方向轮廓波变换有效地捕捉光场图像中场景结构变化的边缘和轮廓细节,充分考虑了人眼视觉系统对于光场图像的主观感知度,具有较好的光场图像质量评价性能。本发明的实施,能够得到匹配于人眼视觉的主观感知度的评价结果。

    基于人眼恰可察觉失真的屏幕内容视频编码感知码率控制方法及装置

    公开(公告)号:CN115567712A

    公开(公告)日:2023-01-03

    申请号:CN202211156529.3

    申请日:2022-09-22

    Applicant: 华侨大学

    Abstract: 本发明公开了一种基于人眼恰可察觉失真的屏幕内容视频编码感知码率控制方法及装置,属于视频编码领域。首先获取屏幕内容视频,对屏幕内容视频进行边缘建模,得到二维边缘模型,提取二维边缘模型的边缘特征,并计算得到二维边缘模型的边缘模型参数;基于边缘模型参数获取亮度自适应阈值、对比度掩蔽效应阈值、边缘非结构失真敏感度阈值以及结构失真敏感度阈值,构建屏幕内容视频的像素域JND模型,确定JND因子;然后利用边缘特征和JND因子指导感知复杂度分类和目标比特分配;最后通过参考视频帧和重建视频帧的边缘相似度构建在JND约束条件下的感知码率控制模型。该方法能够提高屏幕内容视频的码率控制精度,明显改善屏幕内容视频的编码率失真性能。

    一种基于Gabor特征和灰度共生矩阵的视频帧内编码快速算法

    公开(公告)号:CN111526371B

    公开(公告)日:2022-12-06

    申请号:CN202010366824.6

    申请日:2020-04-30

    Applicant: 华侨大学

    Abstract: 本发明涉及一种基于Gabor特征和灰度共生矩阵的视频帧内编码快速算法,属于视频编码领域。本方法利用灰度共生矩阵非零值个数与编码树单元(Coding Tree Unit,CTU)分割深度的关系,设定阈值预判编码模块的分割深度,得到不同阈值对应的深度区间;然后对深度范围内的编码单元(Coding Unit,CU)利用Gabor特征进行分类,并进行平坦块和复杂块的划分,最后根据不同的CU类型选择不同编码方案。本发明一种基于Gabor特征和灰度共生矩阵的屏幕内容视频帧内编码快速算法能够减少编码器计算开销,在保持视频质量基本不变的情况下,减少编码时间。

Patent Agency Ranking