轻量级人脸美丽度评价方法、装置、设备及介质

    公开(公告)号:CN118298274A

    公开(公告)日:2024-07-05

    申请号:CN202410341732.0

    申请日:2024-03-25

    申请人: 五邑大学

    摘要: 本申请提供了轻量级人脸美丽度评价方法、装置、设备及介质,通过训练图像数据训练初始评价模型得到目标评价模型,将待评价的图像数据输入至目标评价模型中进行人脸美丽度评价;在训练初始评价模型的过程中,对训练图像数据进行分块操作,根据特征提取算子对第一图像数据进行特征提取,通过不同尺寸的第一特征数据并按照不同的正则化方法进行多阶段训练,随训练阶段的递进,第一特征数据的尺寸逐渐增大,正则化方法的正则化强度逐渐增强;使网络在不同阶段快速而稳定地收敛;不仅有助于避免训练过程中的梯度爆炸或梯度消失等问题,还能够使模型更好地适应不同数据分布和任务要求,从而提高了模型的泛化能力和性能稳定性。

    基于元学习的人脸美丽度评价方法、装置、设备及介质

    公开(公告)号:CN118212499A

    公开(公告)日:2024-06-18

    申请号:CN202410321911.8

    申请日:2024-03-20

    申请人: 五邑大学

    摘要: 本申请提供了基于元学习的人脸美丽度评价方法、装置、设备及介质,其中方法包括对人脸图像进行特征提取,融合局部纹理特征得到融合特征数据;对辅助图像进行特征提取,得到辅助特征数据;利用融合人脸特征训练用于人脸美丽度评估任务的第一元学习器以更新第一参数;利用辅助特征数据训练用于辅助任务的第二元学习器以更新第二参数;根据第一参数和第二参数得到目标元学习器;根据基于目标元学习器的模型进行人脸美丽度评价得到人脸美丽度结果;克服了单一特征训练模型效果不佳的缺点,从而提高模型整体的鲁棒性;通过辅助任务为人脸美丽度评价主任务提供更丰富的浅层特征,提高主任务的性能。

    高自由度类不平衡性损失函数的调整方法和存储介质

    公开(公告)号:CN111831956B

    公开(公告)日:2024-05-28

    申请号:CN202010548112.6

    申请日:2020-06-16

    申请人: 五邑大学

    IPC分类号: G06F17/10 G06F18/24

    摘要: 本发明公开了一种高自由度类不平衡性损失函数的调整方法和存储介质,包括:采用标准交叉熵损失函数来对训练网络进行训练;根据收敛后的所述训练网络计算所述标准交叉熵损失函数的梯度模长;根据所述梯度模长来选择梯度均衡损失函数或者自适应调整权重损失函数;其中,所述梯度均衡损失函数用于均衡batch数据内落入所述梯度模长中每个区间的数量;所述自适应调整权重损失函数用于使每个所述batch数据自适应调整权重。本发明实施例可以根据数据集的特点自适应选取损失函数,然后在网络训练过程中再次自适应调整权重来充分学习图像特征,尤其是学习难度较大的样本,能够在充分利用有限数据资源的前提下有效解决类别不平衡问题。

    多任务的人脸美丽预测方法、装置、设备及介质

    公开(公告)号:CN116758605A

    公开(公告)日:2023-09-15

    申请号:CN202310533611.1

    申请日:2023-05-11

    申请人: 五邑大学

    摘要: 本申请实施例提供了多任务的人脸美丽预测方法、装置、设备及介质,其中方法包括根据人脸图像训练多任务教师模型得到第一模型;根据美丽等级标签和噪声标签对第一模型进行正则化处理得到第二模型;对多个第二模型进行协同教学得到目标模型参数;将目标模型参数代入多任务学生模型得到目标模型;利用目标模型进行人脸美丽预测处理得到人脸美丽预测结果;通过正则化实现特征压缩,并结合协同教学,进一步防止网络过度拟合噪声标签;基于多任务训练建立模型框架,利用多个相关任务的监督信息,共享模型参数,提高模型对噪声的鲁棒性和模型的泛化能力,提高人脸美丽预测的准确率。

    基于多任务与弱监督的美丽预测方法、装置及存储介质

    公开(公告)号:CN111832436B

    公开(公告)日:2023-06-16

    申请号:CN202010587525.5

    申请日:2020-06-24

    申请人: 五邑大学

    摘要: 本发明公开了基于多任务与弱监督的美丽预测方法、装置及存储介质,其中方法包括:预处理输入的人脸图像;将预处理图像分配至多个任务;提取共享的图像特征;通过多个由残差网、标准神经网络和分类器组成的分类网络得到多个分类结果;利用多任务间的相关性和差异性,增强主任务人脸美丽预测的表达能力;通过弱监督模式的分类网络,减少对真值标签的依赖,降低数据标注成本和降低噪声标签对人脸美丽预测模型的影响,提高人脸美丽预测模型的泛化能力。

    一种基于多任务迁移学习的数字档案图像的矫正方法

    公开(公告)号:CN111696056B

    公开(公告)日:2023-05-02

    申请号:CN202010450013.4

    申请日:2020-05-25

    申请人: 五邑大学

    IPC分类号: G06T5/00 G06T3/40 G06N20/00

    摘要: 本发明公开了一种基于多任务迁移学习的数字档案图像的矫正方法,方法包括:构建多任务学习数字档案图像数据库;将已训练完成的卷积神经网络模型进行模型迁移,构建多任务迁移学习模型,将多任务学习数字档案图像数据库中的数字档案图像输入至多任务迁移学习模型的共享特征层,构建全连接层,以训练多任务迁移学习模型;将测试的数字档案图像输入至训练完成后的多任务迁移学习模型中,得到任务输出结果。本发明利用训练好的网络模型直接进行参数迁移,避免重新训练大规模的深度网络,并通过多个任务之间的相关性和差异性来提高数字档案图像矫正的准确性和提高网络模型的泛化能力。

    一种印刷体与手写体混合文本行提取系统

    公开(公告)号:CN108537146B

    公开(公告)日:2023-03-31

    申请号:CN201810241986.X

    申请日:2018-03-22

    申请人: 五邑大学

    摘要: 本发明公开了一种印刷体与手写体混合文本行提取系统,包括文本块区域预处理以及文本行提取;本发明先通过文本块区域预处理过程,对包含有印刷体或手写体或混合文本的文档图像进行扭斜校正,通过版面分析获取文本块区域;然后对文本块区域进行连通域聚类并分配所属文本行标签,并对粘连字符像素进行聚类分割并重新分配所属文本行标签;最后通过文本行标签实现文档图像文本行的提取。本发明克服了现有技术中的手写文本或印刷体与手写体混合文本中的文本行因倾斜粘连而造成的提取笔画信息丢失或冗余笔画信息引入的缺陷,提高了文本行提取过程中的像素可控性,从而达到快速高效地提取文本行的目的。