一种语音驱动的高度风格化人脸视频生成方法

    公开(公告)号:CN119360880A

    公开(公告)日:2025-01-24

    申请号:CN202411460390.0

    申请日:2024-10-18

    Abstract: 本发明提供了一种语音驱动的高度风格化人脸视频生成方法,包括以下步骤:采集真实图像和原始音频,提取真实图像中的初始关键点和原始音频中的特征,得到原始说话者的无关关键点位移和相关关键点位移;将初始关键点、无关关键点位移和相关关键点位移相加,得到真实人脸关键点序列;将真实人脸关键点序列输入基于CycleGAN的关键点变换网络中,得到风格化人脸关键点序列;将真实人脸关键点序列和风格化人脸关键点序列输入生成器中,得到风格化人脸和真实域图像;将风格化人脸和原始音频结合,得到风格化人脸视频。本发明能够解决风格化人脸的中间表示问题,改善了风格化人脸视频的生成效果,有效地生成多样风格化的说话人脸视频。

    一种选择参数高效微调模块的方法

    公开(公告)号:CN117094361B

    公开(公告)日:2024-01-26

    申请号:CN202311352064.3

    申请日:2023-10-19

    Abstract: 本发明提供了一种选择参数高效微调模块的方法,包括:获取待选择参数高效微调模块和输入样本的最终隐状态;构建参数高效微调超网络并根据所述输入样本的最终隐状态,得到输入样本的最后表征;所述输入样本的最后表征为学习系数与输入样本的最终隐状态相乘;判断所述学习系数是否大于阈值,若是,则所述待选择参数高效微调模块为选中,若否,则所述待选择参数高效微调模块为舍弃。本发明解决了现有技术中大规模语言模型微调方法选择性少并且训练过程消耗大的问题。

    一种高效学习人类反馈的对话回复生成方法

    公开(公告)号:CN116432146A

    公开(公告)日:2023-07-14

    申请号:CN202310414427.5

    申请日:2023-04-18

    Abstract: 本发明提供了一种高效学习人类反馈的对话回复生成方法,包括:获取初始语言对话模型,向所述初始语言对话模型接入评分模块,构建第一语言对话模型;基于对话标注数据集,所述第一语言对话模型根据第一对话历史生成若干个不同回复Ri;Ri为第i个回复;对所述不同回复Ri进行筛选,得到筛选后的回复R*;对所述R*进行改写得到改写回复Rg;基于所述最优回复Rg,将所述第一语言对话模型生成的回复与所述最优回复Rg的对数似然函数最大化。本发明解决了现有技术中显存消耗高,语言对话模型回复质量低的问题。

    基于数字人多模态交互信息标准的智能交互方法

    公开(公告)号:CN115167674A

    公开(公告)日:2022-10-11

    申请号:CN202210797802.4

    申请日:2022-07-06

    Abstract: 本发明公开了基于数字人多模态交互信息标准的智能交互方法,该智能交互方法具体包括如下步骤:获取人机界面的交互信息;基于多模态融合的信息识别;应用系统的交互处理与业务处理;数字人的多模态信息的合成;输出多模态的人机交互信息,本发明对不同模态获取通道所得到的信息交互数据进行综合利用,整合为多模态的行为特征,最终得到符合多模态交互的信息标准的统一语义描述,从而全面理解用户的真实意图,从而减少了人机在信息交互过程中的隔阂,丰富了交互的内容,营造了和谐的人机交互环境,提高了人机交互过程中的自然性和高效性,推动人机智能交互走向新的高度。

    模型训练及语音生成方法、装置、设备及存储介质

    公开(公告)号:CN117423329B

    公开(公告)日:2024-02-23

    申请号:CN202311746255.8

    申请日:2023-12-19

    Abstract: 本公开实施例公开了一种模型训练及语音生成方法、装置、设备及存储介质。该方法包括:获取初始生成模型,初始生成模型为经过预训练的条件扩散模型;获取用户数据,用户数据包括用于反映目标人物特性的文本语音对数据;将初始生成模型作为待训练模型,并基于用户数据,调整待训练模型的激活函数,得到目标模型,目标模型用于语音生成。

    一种基于提示的高效率小样本对话语义理解方法

    公开(公告)号:CN115983282A

    公开(公告)日:2023-04-18

    申请号:CN202310272467.0

    申请日:2023-03-21

    Abstract: 本发明提供了一种基于提示的高效率小样本对话语义理解方法,包括:收集槽位标签的中文名称及描述语句,得到预训练数据集,构造提示模板,搭建小样本微调语言模型,将提示模板及预训练数据集输入小样本微调语言模型,对小样本微调语言模型进行训练,输入需要预测的语句,进行小样本对话语义理解预测。本发明提供的基于提示的高效率小样本对话语义理解方法,通过在提示中陈述槽类型来预测槽值,减少了解码和预测的所需要的模型前向传播次数,在不损失模型表现的同时,大大提高了模型的效率。

    一种选择参数高效微调模块的方法

    公开(公告)号:CN117094361A

    公开(公告)日:2023-11-21

    申请号:CN202311352064.3

    申请日:2023-10-19

    Abstract: 本发明提供了一种选择参数高效微调模块的方法,包括:获取待选择参数高效微调模块和输入样本的最终隐状态;构建参数高效微调超网络并根据所述输入样本的最终隐状态,得到输入样本的最后表征;所述输入样本的最后表征为学习系数与输入样本的最终隐状态相乘;判断所述学习系数是否大于阈值,若是,则所述待选择参数高效微调模块为选中,若否,则所述待选择参数高效微调模块为舍弃。本发明解决了现有技术中大规模语言模型微调方法选择性少并且训练过程消耗大的问题。

Patent Agency Ranking