一种基于可线性扩展学习基因的模型初始化方法

    公开(公告)号:CN117273068B

    公开(公告)日:2024-04-16

    申请号:CN202311264810.3

    申请日:2023-09-28

    Applicant: 东南大学

    Inventor: 耿新 夏诗禹 杨旭

    Abstract: 本发明提供了一种基于可线性扩展学习基因的模型初始化方法,包括:首先创建一个由学习基因线性扩展的辅助Transformer,通过蒸馏方法训练Transformer;然后通过线性扩展训练完毕的学习基因来初始化不同深度的Transformer,以适应不同的下游任务。本发明方法训练一个通用的、可线性扩展的学习基因,该学习基因可用于初始化不同深度的后代模型,同时综合考虑到模型的性能和资源问题,不需要再对各特定模型进行预训练;从祖先模型中提炼出学习基因,之后就不再需要祖先模型,节省额外开销。采用本发明方法初始化不同深度的Transformer,在下游任务上表现出良好的性能。

    半监督人脸年龄估计装置及半监督人脸年龄估计方法

    公开(公告)号:CN105678253B

    公开(公告)日:2019-01-18

    申请号:CN201610003658.7

    申请日:2016-01-04

    Applicant: 东南大学

    Inventor: 耿新 侯鹏

    Abstract: 本发明公开了一种半监督人脸年龄估计装置。该装置训练方法为:步骤1、获取人脸图片数据集,并进行图像特征提取;步骤2、对有年龄标记的每一幅人脸图片,为其初始化年龄分布,并作为训练集;步骤3、利用当前训练集训练LBFGS‑LLD模型,并对所有图片进行年龄分布预测;步骤4、计算无年龄标记人脸图片的伪年龄;步骤5、将所有图片进行年龄分组,优化求解各年龄组所对应的方差,并用得到的方差更新相应年龄组内人脸图片的年龄分布;步骤6、以更新后的所有图片作为新的训练集,转步骤3;直至满足迭代终止条件。本发明还公开了基于该装置的半监督人脸年龄估计方法。本发明仅需使用少量有年龄标记人脸图片结合更多的无年龄标记人脸图片,即可获得更好的年龄估计精度。

    一种基于卷积网络的表观年龄预测算法及其系统

    公开(公告)号:CN106228139A

    公开(公告)日:2016-12-14

    申请号:CN201610598661.8

    申请日:2016-07-27

    Applicant: 东南大学

    Inventor: 耿新 邢超 霍增炜

    CPC classification number: G06K9/00288 G06K2009/00322 G06N3/084

    Abstract: 本发明公开了一种基于卷积网络的表观年龄预测算法及其系统,首先对数据集进行预处理,然后选择一个预训练好的卷积网络作为初始网络,在划分后的传统的年龄数据集上对卷积网络进行训练,得到多个新的卷积网络,之后再用表观年龄数据集对这些新的卷积网络进行训练,得到多个训练后的卷积网络。最终使用集成方法来对这些网络进行集成,得到最终训练好的表观年龄预测模型。基于此模型,本发明还公开了一种基于卷积网络的表观年龄预测的系统,该系统使用表观年龄预测模型进行预测,得到最终的预测年龄。本发明可以快速、有效地训练出用于表观年龄预测的模型,而且预测的准确度很高,在常见的表观年龄数据集上取得了很好的效果。

    半监督人脸年龄估计装置及半监督人脸年龄估计方法

    公开(公告)号:CN105678253A

    公开(公告)日:2016-06-15

    申请号:CN201610003658.7

    申请日:2016-01-04

    Applicant: 东南大学

    Inventor: 耿新 侯鹏

    CPC classification number: G06K9/00228 G06K9/00288 G06K9/627 G06K2009/00322

    Abstract: 本发明公开了一种半监督人脸年龄估计装置。该装置训练方法为:步骤1、获取人脸图片数据集,并进行图像特征提取;步骤2、对有年龄标记的每一幅人脸图片,为其初始化年龄分布,并作为训练集;步骤3、利用当前训练集训练LBFGS-LLD模型,并对所有图片进行年龄分布预测;步骤4、计算无年龄标记人脸图片的伪年龄;步骤5、将所有图片进行年龄分组,优化求解各年龄组所对应的方差,并用得到的方差更新相应年龄组内人脸图片的年龄分布;步骤6、以更新后的所有图片作为新的训练集,转步骤3;直至满足迭代终止条件。本发明还公开了基于该装置的半监督人脸年龄估计方法。本发明仅需使用少量有年龄标记人脸图片结合更多的无年龄标记人脸图片,即可获得更好的年龄估计精度。

    基于标记分布学习的多源域领域泛化行人重识别系统及方法

    公开(公告)号:CN114821809B

    公开(公告)日:2024-07-16

    申请号:CN202210574746.8

    申请日:2022-05-25

    Applicant: 东南大学

    Abstract: 本发明提供一种基于标记分布学习的多源域领域泛化行人重识别系统及方法,至少包括训练模块、类别间关系挖掘模块、领域分布对齐模块和训练方式模块,所述系统通过类别间关系挖掘模块挖掘不同类别间的关系信息并标记,再根据标记分布反映的领域间关系对类别标记分布进行修改,通过领域分布对齐模块使模型对类别所处领域以外的领域更多且同等关注,缓解源域和目标域之间的域差,从标记分布学习的角度解决了领域泛化行人重识别问题,一方面挖掘了不同类别之间的关系提升了模型的判别性,另一方面消除了不同领域之间的数据分布差异提升了模型的泛化性,进一步推动行人重识别应用的实际落地。

    继承祖先模型知识到后代模型的学习基因框架及分类方法

    公开(公告)号:CN117291261A

    公开(公告)日:2023-12-26

    申请号:CN202311217429.1

    申请日:2023-09-20

    Applicant: 东南大学

    Inventor: 耿新 王秋锋 杨旭

    Abstract: 本发明提供了继承祖先模型知识到后代模型的学习基因框架及分类方法,框架包括:(1)知识累积:在祖辈模型的持续学习过程中积累知识。(2)信息浓缩:累积知识被浓缩成更加紧致的信息片段,也就是学习基因。(3)知识传承:浓缩的学习基因被继承以帮助后代模型们快速适应新任务。本发明启发于祖辈进化的信息被浓缩到基因中,从而赋予后代们快速适应环境的能力。本发明中浓缩和继承的过程可以帮助目标用户以更高效的方式利用最先进的模型来解决特定任务,并且可以保护祖辈模型和后代模型的所有者的数据隐私。

    一种基于可线性扩展学习基因的模型初始化方法

    公开(公告)号:CN117273068A

    公开(公告)日:2023-12-22

    申请号:CN202311264810.3

    申请日:2023-09-28

    Applicant: 东南大学

    Inventor: 耿新 夏诗禹 杨旭

    Abstract: 本发明提供了一种基于可线性扩展学习基因的模型初始化方法,包括:首先创建一个由学习基因线性扩展的辅助Transformer,通过蒸馏方法训练Transformer;然后通过线性扩展训练完毕的学习基因来初始化不同深度的Transformer,以适应不同的下游任务。本发明方法训练一个通用的、可线性扩展的学习基因,该学习基因可用于初始化不同深度的后代模型,同时综合考虑到模型的性能和资源问题,不需要再对各特定模型进行预训练;从祖先模型中提炼出学习基因,之后就不再需要祖先模型,节省额外开销。采用本发明方法初始化不同深度的Transformer,在下游任务上表现出良好的性能。

    一种面向移动端的手势识别和跟踪方法及系统

    公开(公告)号:CN116092178A

    公开(公告)日:2023-05-09

    申请号:CN202211488944.9

    申请日:2022-11-25

    Applicant: 东南大学

    Abstract: 本发明公开了一种面向移动端的手势识别和跟踪方法及系统,包括:手部图像检测模块至少包括YOLOv5的手部检测模型,将原始图像输入手部检测模型进行处理,输出包括检测框、左手置信度、右手置信度及是否有手的置信度的手部图像检测结果;手势估计模块至少包括手势估计模型,手势估计模型网络的特征提取部分为轻量化网络ShuffleNet V2 0.5x模块,姿态网络部分为3个反卷积层与1个内核大小为1的卷积层,将手部图像检测模块处理后的手部图片输入手势估计模块,输出21个手势关键点估计结果;三维转换模块利用两视图几何,将手势估计模块输出的2D关键点转为3D,使用Levenberg‑Marquardt算法、相机内外参数以及惯性测量单元参数,生成三维关键点坐标,实现手势的识别和跟踪。

    基于标记分布的解决类别缺失问题的人类年龄自动估计方法

    公开(公告)号:CN106650642B

    公开(公告)日:2019-09-10

    申请号:CN201611107603.7

    申请日:2016-12-06

    Applicant: 东南大学

    Inventor: 耿新 霍增炜

    Abstract: 本发明公开一种基于标记分布来解决类别缺失问题的人类年龄自动估计方法,步骤为:(1)获取用于训练的人脸图像训练集并且对人脸图像进行特征抽取;(2)对已经抽取好的特征进行降维;(3)收集每一幅人脸图像的年龄信息,根据年龄信息,生成该图像对应的标记分布;(4)使用图像特征向量及生成的标记分布训练模型,计算最大熵模型预测的标记分布与真实年龄的标记分布的Jeffrey散度,再加入平滑正则项作为目标函数,并对该目标函数进行优化;(5)最后得出待测人脸图像的年龄输出。本发明可以快速有效地训练出用于预测缺失类别的人类年龄自动估计的模型,并且不同于传统的训练集类别缺失问题,不需要辅助信息进行训练。

    基于稀疏无向概率图模型的人脸年龄估计方法、系统

    公开(公告)号:CN105718898B

    公开(公告)日:2019-01-08

    申请号:CN201610045986.3

    申请日:2016-01-22

    Applicant: 东南大学

    Inventor: 耿新 杨旭

    Abstract: 本发明公开了一种基于稀疏无向概率图模型的人脸年龄估计方法,属于机器学习和模式识别技术领域。本发明创新性地利用无向概率图构建了一个年龄分布预测模型,并且在模型的优化训练目标中加入合适的稀疏性正则项去约束模型参数。本发明还公开了一种基于稀疏无向概率图模型的人脸年龄估计系统。相比现有技术,本发明最大的两个优点在于:1.可以从复杂的图像特征中学习到更为丰富的信息去预测年龄分布,并且使用词向量对这些信息进行更为紧凑的编码。2.本方面利用了图像稀疏性的先验,加入了稀疏性正则项去约束模型参数,使得学习出来的模型有更好的泛化性。

Patent Agency Ranking