-
公开(公告)号:CN109784191B
公开(公告)日:2021-01-01
申请号:CN201811559959.3
申请日:2018-12-20
Applicant: 华南理工大学 , 华南理工大学珠海现代产业创新研究院
Abstract: 本发明公开了一种基于商图像的多任务人脸光照编辑方法,包含以下步骤:(1)预处理:对目标人脸与参考人脸进行人脸检测与人脸配准;(2)商图像特征提取:根据不同的人脸光照编辑任务提取相应的初始商图像特征;(3)商图像特征扩散:根据目标人脸把初始商图像特征扩散到整幅图像;(4)商图像融合:根据不同的人脸光照编辑任务把目标人脸与商图像进行融合,实现相应的光照迁移、光照归一化。本发明方法能在一个技术框架内同时实现人脸的光照迁移与光照归一化效果,提高人脸光照编辑系统的复用性、可扩展性,同时能自动地提取人脸的光照信息,并根据不同任务与人脸的特点自适应地进行光照调节,提高了人脸光照编辑的效率和易用性。
-
公开(公告)号:CN109344855B
公开(公告)日:2021-09-24
申请号:CN201810909935.X
申请日:2018-08-10
Applicant: 华南理工大学 , 华南理工大学珠海现代产业创新研究院
Abstract: 本发明公开了一种基于排序引导回归的深度模型的人脸美丽评价方法,包括:采集人脸图片并进行预处理和标注;对训练集采样,构建一个可以同时处理排序和回归任务的人脸美丽评价模型,包括回归子网络和排序子网络;将采样得到的成对图片输入到该网络模型中,利用回归损失和排序损失作为监督信号,以层级微调的优化方式来训练网络模型直至收敛;将需要预测的人脸图片输入人脸美丽评价模型的任意一个回归子网络中,输出的分数即为评价结果。本发明通过在深度网络模型的训练阶段中引入了相对审美的机制,有效地反映了人类对人脸审美的本质,使得提取的人脸美丽特征具有更好的泛化能力,从而使深度网络模型的人脸美丽预测能力更加接近于人类水平。
-
公开(公告)号:CN112381761A
公开(公告)日:2021-02-19
申请号:CN202011087298.6
申请日:2020-10-12
Applicant: 华南理工大学 , 华南理工大学珠海现代产业创新研究院
Abstract: 本发明公开了一种鲁棒的低光照增强图像质量评价方法,过程如下:对输入的图像进行颜色空间转换,分离得到图像的亮度和色度通道信息,根据亮度和色度通道信息合成亮度和色度图像;根据分离得到的图像信息,利用特征提取网络分别提取参考图像和低光照增强后图像的亮度特征、对比度特征、颜色特征、全局结构特征以及纹理细节特征;计算参考图像和低光照增强后图像的亮度特征、对比度特征、颜色特征、全局结构特征以及纹理细节特征的相似性系数;通过训练优化神经网络的方法得到最佳的图像特征相似性系数的权重参数,根据权重参数进行相似性系数的相加求和,得到最终低光增强后图像的质量评分。
-
公开(公告)号:CN109344855A
公开(公告)日:2019-02-15
申请号:CN201810909935.X
申请日:2018-08-10
Applicant: 华南理工大学 , 华南理工大学珠海现代产业创新研究院
Abstract: 本发明公开了一种基于排序引导回归的深度模型的人脸美丽评价方法,包括:采集人脸图片并进行预处理和标注;对训练集采样,构建一个可以同时处理排序和回归任务的人脸美丽评价模型,包括回归子网络和排序子网络;将采样得到的成对图片输入到该网络模型中,利用回归损失和排序损失作为监督信号,以层级微调的优化方式来训练网络模型直至收敛;将需要预测的人脸图片输入人脸美丽评价模型的任意一个回归子网络中,输出的分数即为评价结果。本发明通过在深度网络模型的训练阶段中引入了相对审美的机制,有效地反映了人类对人脸审美的本质,使得提取的人脸美丽特征具有更好的泛化能力,从而使深度网络模型的人脸美丽预测能力更加接近于人类水平。
-
公开(公告)号:CN112381761B
公开(公告)日:2022-09-30
申请号:CN202011087298.6
申请日:2020-10-12
Applicant: 华南理工大学 , 华南理工大学珠海现代产业创新研究院
Abstract: 本发明公开了一种鲁棒的低光照增强图像质量评价方法,过程如下:对输入的图像进行颜色空间转换,分离得到图像的亮度和色度通道信息,根据亮度和色度通道信息合成亮度和色度图像;根据分离得到的图像信息,利用特征提取网络分别提取参考图像和低光照增强后图像的亮度特征、对比度特征、颜色特征、全局结构特征以及纹理细节特征;计算参考图像和低光照增强后图像的亮度特征、对比度特征、颜色特征、全局结构特征以及纹理细节特征的相似性系数;通过训练优化神经网络的方法得到最佳的图像特征相似性系数的权重参数,根据权重参数进行相似性系数的相加求和,得到最终低光增强后图像的质量评分。
-
公开(公告)号:CN109784191A
公开(公告)日:2019-05-21
申请号:CN201811559959.3
申请日:2018-12-20
Applicant: 华南理工大学 , 华南理工大学珠海现代产业创新研究院
Abstract: 本发明公开了一种基于商图像的多任务人脸光照编辑方法,包含以下步骤:(1)预处理:对目标人脸与参考人脸进行人脸检测与人脸配准;(2)商图像特征提取:根据不同的人脸光照编辑任务提取相应的初始商图像特征;(3)商图像特征扩散:根据目标人脸把初始商图像特征扩散到整幅图像;(4)商图像融合:根据不同的人脸光照编辑任务把目标人脸与商图像进行融合,实现相应的光照迁移、光照归一化。本发明方法能在一个技术框架内同时实现人脸的光照迁移与光照归一化效果,提高人脸光照编辑系统的复用性、可扩展性,同时能自动地提取人脸的光照信息,并根据不同任务与人脸的特点自适应地进行光照调节,提高了人脸光照编辑的效率和易用性。
-
公开(公告)号:CN119295550B
公开(公告)日:2025-03-28
申请号:CN202411815659.2
申请日:2024-12-11
Applicant: 华南理工大学
IPC: G06T7/73 , G06N3/0464 , G06T7/277 , G06V10/25 , G06V10/30 , G06V10/44 , G06V10/46 , G06V10/52 , G06V10/62 , G06V10/82
Abstract: 本发明公开了一种海洋网箱栏杆视觉追踪与定位方法及系统。所述方法包括以下步骤:对单目RGB摄像头采集的图像进行预处理;在预处理后的图像中识别海洋网箱栏杆,采用基于深度学习的目标检测算法初步检测海洋网箱栏杆的位置,结合特征匹配方法进一步确认海洋网箱栏杆的位置;对已识别的海洋网箱栏杆进行持续追踪,采用卡尔曼滤波预测栏杆的运动状态,并结合meanshift目标跟踪、时序信息融合、运动补偿技术,实现对栏杆目标的稳定锁定;根据已识别和追踪到的海洋网箱栏杆,利用单目视觉以及尺度信息估计无人船与海洋网箱之间的距离。本发明基于经济实用的单目摄像头,实现对海洋网箱栏杆的精准识别、稳定追踪和距离估计。
-
公开(公告)号:CN116092069A
公开(公告)日:2023-05-09
申请号:CN202310058072.0
申请日:2023-01-17
Applicant: 华南理工大学
IPC: G06V20/62 , G06V20/40 , G06V10/52 , G06V10/764 , G06V10/766 , G06V10/82 , G06V10/46 , G06V10/80 , G06T7/246 , G06N3/0464 , G06N3/045
Abstract: 本发明公开了一种基于轮廓建模的自然场景视频文本检测方法及系统,包括视频帧读取与初始化,提取图像帧信息、文本区域信息预测,帧间文本信息融合、GPU加速后处理及视频帧追踪,所述帧间文本信息融合是设定两个大小不同的阈值对相邻两帧预测的文本信息进行融合筛选得到增强后的文本信息。本方法使用傅里叶帧间融合建模文本轮廓,辅以匹配算法对文本目标进行追踪,同时使用GPU加速推理,在保证了较高水准的检测准确率的情况下能够实现对视频文本的实时检测。
-
公开(公告)号:CN109308726B
公开(公告)日:2023-04-28
申请号:CN201811044262.2
申请日:2018-09-07
Applicant: 华南理工大学
Inventor: 梁凌宇
IPC: G06T11/00 , G06V10/764 , G06V10/74
Abstract: 本发明公开了人脸图像编辑模板的快速生成方法,包括:对已知人脸图像编辑模板的初始值R进行分类,得到向量形式的子集RS和RC,其中R=(RS,RC);根据待求人脸图像编辑模板T的类型对应的邻接点相似度计算权重矩阵W;根据限定矩阵U和子集RS计算待求人脸图像编辑模板T的子集TS;根据权重矩阵W和子集TS计算待求人脸图像编辑模板T的子集TC;将子集TS和子集TC合成待求人脸图像编辑模板T。本发明把大规模矩阵求解问题转化为小规模矩阵问题,能广泛应用人脸图像编辑系统中,对高分辨率人脸图像编辑能有效提高其计算速度、降低人脸图像编辑模板的计算复杂度。
-
公开(公告)号:CN114581905A
公开(公告)日:2022-06-03
申请号:CN202210375908.5
申请日:2022-04-11
Applicant: 华南理工大学
Abstract: 本发明公开一种基于语义增强机制的场景文本识别方法及系统,包括获取场景文本图像,对场景文本图像进行校正,对校正后的场景文本图像进行特征提取,获取视觉特征,基于视觉特征提取全局语义信息,基于全局语义信息,对视觉特征进行解码转录,得到场景文本识别字符串结果。通过上述技术方案,本发明使场景文本图像的识别能够更加准确。
-
-
-
-
-
-
-
-
-