-
公开(公告)号:CN119360880A
公开(公告)日:2025-01-24
申请号:CN202411460390.0
申请日:2024-10-18
Applicant: 北京中科汇联科技股份有限公司 , 清华大学
Abstract: 本发明提供了一种语音驱动的高度风格化人脸视频生成方法,包括以下步骤:采集真实图像和原始音频,提取真实图像中的初始关键点和原始音频中的特征,得到原始说话者的无关关键点位移和相关关键点位移;将初始关键点、无关关键点位移和相关关键点位移相加,得到真实人脸关键点序列;将真实人脸关键点序列输入基于CycleGAN的关键点变换网络中,得到风格化人脸关键点序列;将真实人脸关键点序列和风格化人脸关键点序列输入生成器中,得到风格化人脸和真实域图像;将风格化人脸和原始音频结合,得到风格化人脸视频。本发明能够解决风格化人脸的中间表示问题,改善了风格化人脸视频的生成效果,有效地生成多样风格化的说话人脸视频。
-
公开(公告)号:CN117094361B
公开(公告)日:2024-01-26
申请号:CN202311352064.3
申请日:2023-10-19
Applicant: 北京中科汇联科技股份有限公司
IPC: G06N3/0455 , G06N3/08
Abstract: 本发明提供了一种选择参数高效微调模块的方法,包括:获取待选择参数高效微调模块和输入样本的最终隐状态;构建参数高效微调超网络并根据所述输入样本的最终隐状态,得到输入样本的最后表征;所述输入样本的最后表征为学习系数与输入样本的最终隐状态相乘;判断所述学习系数是否大于阈值,若是,则所述待选择参数高效微调模块为选中,若否,则所述待选择参数高效微调模块为舍弃。本发明解决了现有技术中大规模语言模型微调方法选择性少并且训练过程消耗大的问题。
-
公开(公告)号:CN116432146A
公开(公告)日:2023-07-14
申请号:CN202310414427.5
申请日:2023-04-18
Applicant: 北京中科汇联科技股份有限公司
IPC: G06F18/40 , G06F18/21 , G06F16/332 , G06F16/35
Abstract: 本发明提供了一种高效学习人类反馈的对话回复生成方法,包括:获取初始语言对话模型,向所述初始语言对话模型接入评分模块,构建第一语言对话模型;基于对话标注数据集,所述第一语言对话模型根据第一对话历史生成若干个不同回复Ri;Ri为第i个回复;对所述不同回复Ri进行筛选,得到筛选后的回复R*;对所述R*进行改写得到改写回复Rg;基于所述最优回复Rg,将所述第一语言对话模型生成的回复与所述最优回复Rg的对数似然函数最大化。本发明解决了现有技术中显存消耗高,语言对话模型回复质量低的问题。
-
公开(公告)号:CN115167674A
公开(公告)日:2022-10-11
申请号:CN202210797802.4
申请日:2022-07-06
Applicant: 北京中科汇联科技股份有限公司
IPC: G06F3/01 , G06F3/0488 , G06F3/16
Abstract: 本发明公开了基于数字人多模态交互信息标准的智能交互方法,该智能交互方法具体包括如下步骤:获取人机界面的交互信息;基于多模态融合的信息识别;应用系统的交互处理与业务处理;数字人的多模态信息的合成;输出多模态的人机交互信息,本发明对不同模态获取通道所得到的信息交互数据进行综合利用,整合为多模态的行为特征,最终得到符合多模态交互的信息标准的统一语义描述,从而全面理解用户的真实意图,从而减少了人机在信息交互过程中的隔阂,丰富了交互的内容,营造了和谐的人机交互环境,提高了人机交互过程中的自然性和高效性,推动人机智能交互走向新的高度。
-
公开(公告)号:CN117423329B
公开(公告)日:2024-02-23
申请号:CN202311746255.8
申请日:2023-12-19
Applicant: 北京中科汇联科技股份有限公司
IPC: G10L13/027
Abstract: 本公开实施例公开了一种模型训练及语音生成方法、装置、设备及存储介质。该方法包括:获取初始生成模型,初始生成模型为经过预训练的条件扩散模型;获取用户数据,用户数据包括用于反映目标人物特性的文本语音对数据;将初始生成模型作为待训练模型,并基于用户数据,调整待训练模型的激活函数,得到目标模型,目标模型用于语音生成。
-
公开(公告)号:CN117235230A
公开(公告)日:2023-12-15
申请号:CN202311318602.7
申请日:2023-10-12
Applicant: 北京中科汇联科技股份有限公司
IPC: G06F16/332 , G06F16/338 , G06F18/22
Abstract: 本发明提供了一种基于消融的大模型示例选择方法,包括:搭建用户问题表征模型,并基于数据库对其进行训练,通过训练后的用户问题表征模型获取用户问题相关的示例,搭建第一语言模型及第二语言模型,并将用户问题及相关的示例输入第一语言模型中。本发明提供的基于消融的大模型示例选择方法,能够在已有的数据库中获取合适的示例,帮助大模型生成更好的回复。
-
公开(公告)号:CN115983282A
公开(公告)日:2023-04-18
申请号:CN202310272467.0
申请日:2023-03-21
Applicant: 北京中科汇联科技股份有限公司
Abstract: 本发明提供了一种基于提示的高效率小样本对话语义理解方法,包括:收集槽位标签的中文名称及描述语句,得到预训练数据集,构造提示模板,搭建小样本微调语言模型,将提示模板及预训练数据集输入小样本微调语言模型,对小样本微调语言模型进行训练,输入需要预测的语句,进行小样本对话语义理解预测。本发明提供的基于提示的高效率小样本对话语义理解方法,通过在提示中陈述槽类型来预测槽值,减少了解码和预测的所需要的模型前向传播次数,在不损失模型表现的同时,大大提高了模型的效率。
-
公开(公告)号:CN117094361A
公开(公告)日:2023-11-21
申请号:CN202311352064.3
申请日:2023-10-19
Applicant: 北京中科汇联科技股份有限公司
IPC: G06N3/0455 , G06N3/08
Abstract: 本发明提供了一种选择参数高效微调模块的方法,包括:获取待选择参数高效微调模块和输入样本的最终隐状态;构建参数高效微调超网络并根据所述输入样本的最终隐状态,得到输入样本的最后表征;所述输入样本的最后表征为学习系数与输入样本的最终隐状态相乘;判断所述学习系数是否大于阈值,若是,则所述待选择参数高效微调模块为选中,若否,则所述待选择参数高效微调模块为舍弃。本发明解决了现有技术中大规模语言模型微调方法选择性少并且训练过程消耗大的问题。
-
公开(公告)号:CN117634595A
公开(公告)日:2024-03-01
申请号:CN202410087649.5
申请日:2024-01-22
Applicant: 北京中科汇联科技股份有限公司
IPC: G06N3/0985 , G06N3/088 , G06N3/092 , G06N3/0442 , G06N3/045 , G06N3/0475
Abstract: 本发明提供了一种基于贡献度的扩散模型快速微调方法,包括:获取经过预训练的扩散模型,获取微调数据集及评估模型,初始化预训练的扩散模型上的LoRA参数及门控,基于微调数据集及评估模型对扩散模型上的LoRA参数及门控进行微调,得到微调后的扩散模型。本发明提供的基于贡献度的扩散模型快速微调方法,能够实现扩散模型的快速微调,便于使用。
-
公开(公告)号:CN116303959A
公开(公告)日:2023-06-23
申请号:CN202310270126.X
申请日:2023-03-20
Applicant: 北京中科汇联科技股份有限公司
IPC: G06F16/332 , G06F18/22 , G06N5/022 , G06N3/0455 , G06N3/096
Abstract: 本发明提供了一种可终身学习的对话状态追踪方法,包括:搭建DST模型,构造DST知识提示模板,对DST模型进行微调,将对话历史、用户输入语句及DST知识提示模板输入微调后的DST模型,得到对应的输出,根据新业务知识,对DST模型进行微调,进行后向知识迁移。本发明提供的可终身学习的对话状态追踪方法,通过结合参数高效的微调方法和跨任务的知识迁移,能够实现新业务的快速开发。
-
-
-
-
-
-
-
-
-