-
公开(公告)号:CN118968265A
公开(公告)日:2024-11-15
申请号:CN202410427508.3
申请日:2024-04-10
申请人: 五邑大学
IPC分类号: G06V10/98 , G06V10/82 , G06N3/096 , G06N3/0464 , G06V40/16 , G06V10/774
摘要: 本申请提供了基于知识蒸馏的人脸美丽度评价方法、装置、设备及介质,将训练人脸图像输入至教师模型进行训练得到第一预测结果;根据第一预测结果生成软标签;将训练人脸图像输入至包括多个深度可分离膨胀卷积层的学生模型进行训练得到第二预测结果;根据第二预测结果与软标签之间的距离得到损失函数;根据损失函数调整学生模型的参数,得到训练后的学生模型;将训练后的学生模型作为训练后的评价模型;引入深度可分离膨胀卷积层,能够学习到教师模型的复杂特征表示,并减少模型的参数量和计算量,提高了感受野,从而进一步提高了模型的性能。
-
公开(公告)号:CN118609185A
公开(公告)日:2024-09-06
申请号:CN202410731666.8
申请日:2024-06-06
申请人: 五邑大学
IPC分类号: G06V40/16 , G06V10/764 , G06V10/80 , G06V10/82 , G06N3/0455 , G06N3/084
摘要: 本申请提供了魅力评价模型的训练方法、魅力评价方法及相关装置,通过将训练人脸图像和性格描述文本输入至魅力评价模型,根据训练人脸图像进行美丽度评价得到美丽度描述文本,根据美丽度描述文本和性格描述文本进行文本分类得到魅力分类结果;根据魅力分类结果对魅力评价模型调参得到训练好的魅力评价模型;利用训练好的魅力评价模型进行魅力评价;将图像描述转换为美丽度的文本描述,降低隐私泄露风险;利用多模态学习聚合多模态输入数据的特征,使得模型学习的表示更完备,使得魅力评价更全面更准确。
-
公开(公告)号:CN118298274A
公开(公告)日:2024-07-05
申请号:CN202410341732.0
申请日:2024-03-25
申请人: 五邑大学
摘要: 本申请提供了轻量级人脸美丽度评价方法、装置、设备及介质,通过训练图像数据训练初始评价模型得到目标评价模型,将待评价的图像数据输入至目标评价模型中进行人脸美丽度评价;在训练初始评价模型的过程中,对训练图像数据进行分块操作,根据特征提取算子对第一图像数据进行特征提取,通过不同尺寸的第一特征数据并按照不同的正则化方法进行多阶段训练,随训练阶段的递进,第一特征数据的尺寸逐渐增大,正则化方法的正则化强度逐渐增强;使网络在不同阶段快速而稳定地收敛;不仅有助于避免训练过程中的梯度爆炸或梯度消失等问题,还能够使模型更好地适应不同数据分布和任务要求,从而提高了模型的泛化能力和性能稳定性。
-
公开(公告)号:CN118212499A
公开(公告)日:2024-06-18
申请号:CN202410321911.8
申请日:2024-03-20
申请人: 五邑大学
IPC分类号: G06V10/82 , G06V10/80 , G06V10/77 , G06V10/764 , G06V40/16 , G06N3/0985
摘要: 本申请提供了基于元学习的人脸美丽度评价方法、装置、设备及介质,其中方法包括对人脸图像进行特征提取,融合局部纹理特征得到融合特征数据;对辅助图像进行特征提取,得到辅助特征数据;利用融合人脸特征训练用于人脸美丽度评估任务的第一元学习器以更新第一参数;利用辅助特征数据训练用于辅助任务的第二元学习器以更新第二参数;根据第一参数和第二参数得到目标元学习器;根据基于目标元学习器的模型进行人脸美丽度评价得到人脸美丽度结果;克服了单一特征训练模型效果不佳的缺点,从而提高模型整体的鲁棒性;通过辅助任务为人脸美丽度评价主任务提供更丰富的浅层特征,提高主任务的性能。
-
公开(公告)号:CN111831956B
公开(公告)日:2024-05-28
申请号:CN202010548112.6
申请日:2020-06-16
申请人: 五邑大学
摘要: 本发明公开了一种高自由度类不平衡性损失函数的调整方法和存储介质,包括:采用标准交叉熵损失函数来对训练网络进行训练;根据收敛后的所述训练网络计算所述标准交叉熵损失函数的梯度模长;根据所述梯度模长来选择梯度均衡损失函数或者自适应调整权重损失函数;其中,所述梯度均衡损失函数用于均衡batch数据内落入所述梯度模长中每个区间的数量;所述自适应调整权重损失函数用于使每个所述batch数据自适应调整权重。本发明实施例可以根据数据集的特点自适应选取损失函数,然后在网络训练过程中再次自适应调整权重来充分学习图像特征,尤其是学习难度较大的样本,能够在充分利用有限数据资源的前提下有效解决类别不平衡问题。
-
公开(公告)号:CN116758605A
公开(公告)日:2023-09-15
申请号:CN202310533611.1
申请日:2023-05-11
申请人: 五邑大学
IPC分类号: G06V40/16 , G06V10/77 , G06V10/774 , G06V10/778 , G06V10/82 , G06N3/045 , G06N3/047 , G06N3/048 , G06N3/091 , G06N3/096
摘要: 本申请实施例提供了多任务的人脸美丽预测方法、装置、设备及介质,其中方法包括根据人脸图像训练多任务教师模型得到第一模型;根据美丽等级标签和噪声标签对第一模型进行正则化处理得到第二模型;对多个第二模型进行协同教学得到目标模型参数;将目标模型参数代入多任务学生模型得到目标模型;利用目标模型进行人脸美丽预测处理得到人脸美丽预测结果;通过正则化实现特征压缩,并结合协同教学,进一步防止网络过度拟合噪声标签;基于多任务训练建立模型框架,利用多个相关任务的监督信息,共享模型参数,提高模型对噪声的鲁棒性和模型的泛化能力,提高人脸美丽预测的准确率。
-
公开(公告)号:CN111832436B
公开(公告)日:2023-06-16
申请号:CN202010587525.5
申请日:2020-06-24
申请人: 五邑大学
IPC分类号: G06V40/16 , G06V10/774 , G06V10/764 , G06V10/82 , G06N3/0464 , G06N3/08
摘要: 本发明公开了基于多任务与弱监督的美丽预测方法、装置及存储介质,其中方法包括:预处理输入的人脸图像;将预处理图像分配至多个任务;提取共享的图像特征;通过多个由残差网、标准神经网络和分类器组成的分类网络得到多个分类结果;利用多任务间的相关性和差异性,增强主任务人脸美丽预测的表达能力;通过弱监督模式的分类网络,减少对真值标签的依赖,降低数据标注成本和降低噪声标签对人脸美丽预测模型的影响,提高人脸美丽预测模型的泛化能力。
-
公开(公告)号:CN111696056B
公开(公告)日:2023-05-02
申请号:CN202010450013.4
申请日:2020-05-25
申请人: 五邑大学
摘要: 本发明公开了一种基于多任务迁移学习的数字档案图像的矫正方法,方法包括:构建多任务学习数字档案图像数据库;将已训练完成的卷积神经网络模型进行模型迁移,构建多任务迁移学习模型,将多任务学习数字档案图像数据库中的数字档案图像输入至多任务迁移学习模型的共享特征层,构建全连接层,以训练多任务迁移学习模型;将测试的数字档案图像输入至训练完成后的多任务迁移学习模型中,得到任务输出结果。本发明利用训练好的网络模型直接进行参数迁移,避免重新训练大规模的深度网络,并通过多个任务之间的相关性和差异性来提高数字档案图像矫正的准确性和提高网络模型的泛化能力。
-
公开(公告)号:CN108537146B
公开(公告)日:2023-03-31
申请号:CN201810241986.X
申请日:2018-03-22
申请人: 五邑大学
IPC分类号: G06V30/32 , G06V30/414 , G06V30/16 , G06V10/82 , G06N3/0464
摘要: 本发明公开了一种印刷体与手写体混合文本行提取系统,包括文本块区域预处理以及文本行提取;本发明先通过文本块区域预处理过程,对包含有印刷体或手写体或混合文本的文档图像进行扭斜校正,通过版面分析获取文本块区域;然后对文本块区域进行连通域聚类并分配所属文本行标签,并对粘连字符像素进行聚类分割并重新分配所属文本行标签;最后通过文本行标签实现文档图像文本行的提取。本发明克服了现有技术中的手写文本或印刷体与手写体混合文本中的文本行因倾斜粘连而造成的提取笔画信息丢失或冗余笔画信息引入的缺陷,提高了文本行提取过程中的像素可控性,从而达到快速高效地提取文本行的目的。
-
公开(公告)号:CN111833356B
公开(公告)日:2023-02-28
申请号:CN202010543134.3
申请日:2020-06-15
申请人: 五邑大学
IPC分类号: G06T7/11 , G06V10/764
摘要: 本发明公开了脑部胶质瘤图像分级方法、装置及存储介质,对输入的脑部胶质瘤图像作归一化处理和作感兴趣区域的增强处理,提高鲁棒性和分级的准确性;基于弱监督原理的掩膜处理能精准地为脑部胶质瘤图像中脑部胶质瘤对应的区域加上掩膜,进一步提高鲁棒性和分级的准确性,进而减少了对大量有真值标签的训练样本数据的依赖性;通过宽度学习网络避免了大规模耗时的网络训练,解决了获取更高精度时,增加网络层数而导致梯度消失和训练缓慢的问题。
-
-
-
-
-
-
-
-
-