一种基于3D先验知识的人脸老化图像生成方法及系统

    公开(公告)号:CN117036559A

    公开(公告)日:2023-11-10

    申请号:CN202311060836.6

    申请日:2023-08-22

    Abstract: 本发明涉及图像生成技术领域,提出了一种基于3D先验知识的人脸老化图像生成方法及系统,包括获得输入人脸图像和目标年龄类别设定值;将输入人脸图像分解为UV位置图和纹理图;对所述UV位置图进行编码得到所述输入人脸图像的形状编码,对所述纹理图进行编码得到所述输入人脸图像的纹理编码;对所述目标年龄类别设定值进行编码,得到隐空间年龄编码;以所述隐空间年龄编码为条件,对所述形状编码进行解码,得到老化UV位置图;以所述隐空间年龄编码为条件,对所述纹理编码进行解码,得到老化纹理图;对所述老化UV位置图和老化纹理图进行渲染,得到目标年龄类别的老化图像。通过上述技术方案,解决了现有技术中人脸老化方法无法生成高质量老化图像的问题。

    灵活多样的人脸图像老化生成系统

    公开(公告)号:CN116342379A

    公开(公告)日:2023-06-27

    申请号:CN202310338136.2

    申请日:2023-03-31

    Abstract: 本发明涉及图像处理技术领域,提出了灵活多样的人脸图像老化生成系统,包括获得单元,用于获得原始输入图像参考图像和预先定义的老化文本tref;CLIP编码器,用于将所述参考图像和所述老化文本tref映射到CLIP隐空间,分别得到隐向量eimg和隐向量etxt;概率年龄预测单元,用文本先验N(etxt,I)做KL散度约束,根据隐向量eimg得到老化条件的概率生成表示eage=N(μφ(eimg),σφ2(eimg)I);扩散自编码器,用于将原始输入图像编码成语义条件第一扩散解码器,用于将语义条件zsrc、预训练扩散自编码器中扩散第t步的加噪图像和老化条件eage解码解成去噪老化编辑后的图像p。通过上述技术方案,解决了现有技术中人脸老化灵活程度低的问题。

    图像有序分类模型训练方法及装置、电子设备、存储介质

    公开(公告)号:CN117437464A

    公开(公告)日:2024-01-23

    申请号:CN202311366292.6

    申请日:2023-10-20

    Abstract: 本公开提供了一种图像有序分类模型训练方法及装置、电子设备、存储介质,该方法包括:获取多个类型的训练样本,每个训练样本中包含文本描述和对应于所述文本描述的第一图像;对所述文本描述进行分词处理,得到每个文本描述的分词;对各个文本描述中的第一分词进行第一排序处理,基于第一排序处理的结果对各个文本描述进行排序;其中,所述第一分词为每个文本描述中用于标识训练样本类型的分词;对每个文本描述中的第二分词进行第二排序处理;其中,所述第二分词为每个文本描述中除第一分词之外的分词;基于第一排序处理和第二排序处理后的文本描述以及所述第一图像训练图像有序分类模型。本公开可以解决相关技术中存在的过拟合问题。

    语音情绪识别模型的训练方法、识别方法和装置

    公开(公告)号:CN116486785A

    公开(公告)日:2023-07-25

    申请号:CN202310273039.X

    申请日:2023-03-20

    Abstract: 本申请提供一种语音情绪识别模型的训练方法、识别方法和装置,涉及语音识别技术领域。该方法包括:在训练语音情绪识别模型时,可以先获取多个语音样本对,各语音样本对包括具有语音情绪标签的第一语音样本和无语音情绪标签的第二语音样本,第一语音样本和第二语音样本所属的语种不同;将语音样本对对应的语音特征输入至初始语音情绪识别模型中,得到语音样本对中第一语音样本和第二语音样本对应的预测结果;根据各语音样本对对应的第一预测结果、第二预测结果以及语音情绪标签,对初始语音情绪识别模型的模型参数进行更新,这样训练得到的语音情绪识别模型,可以准确地识别不同语种的语音情绪,从而提高了识别结果的准确度。

Patent Agency Ranking