AI模型的训练方法、装置、计算设备和存储介质

    公开(公告)号:CN114154641A

    公开(公告)日:2022-03-08

    申请号:CN202011053283.8

    申请日:2020-09-29

    Abstract: 本申请提供了一种AI模型的训练方法、装置、计算设备和存储介质,属于人工智能技术领域。该方法应用于AI平台,AI平台与计算资源池相关联,计算资源池包括用于模型训练的计算节点,该方法包括:向用户提供训练配置界面,训练配置界面包括供用户选择的多种训练模式,每种训练模式表示对训练初始AI模型所需的计算节点的一种分配策略,根据用户在训练配置界面的选择,生成至少一个训练任务,执行该至少一个训练任务以对初始AI模型进行训练,获得AI模型,获得的AI模型供用户下载或使用。采用本申请,可以更灵活地执行分布式训练。

    一种生成语音克隆模型的方法及相关装置

    公开(公告)号:CN119380726A

    公开(公告)日:2025-01-28

    申请号:CN202311278704.0

    申请日:2023-09-28

    Abstract: 本申请提供了一种生成语音克隆模型的方法及相关装置,方法应用于语音克隆领域,包括:获取用户通过终端设备输入的对多个参考音频的打分结果;基于多个参考音频和用户对多个参考音频的打分结果进行训练,获得声学反馈单元,声学反馈单元用于衡量用户对不同音频的听觉感受;获取用户通过终端设备输入的第一语音数据集;基于第一语音数据集和声学反馈单元,对语音克隆模型进行训练,获得语音克隆模型。在语音克隆模型训练过程中,考虑到了用户对不同音频的喜欢程度,将用户对多个参考音频的打分结果加入到语音克隆模型的训练过程中,训练获得的语音克隆模型更符合用户的使用需求,使用训练得到的语音克隆模型生成的语音更能满足用户的听觉感受。

    2d数字人动作库的生成方法、装置、集群和存储介质

    公开(公告)号:CN119091015A

    公开(公告)日:2024-12-06

    申请号:CN202311100254.6

    申请日:2023-08-29

    Abstract: 本公开提供了一种2d数字人动作库的生成方法、装置、集群和存储介质,属于2d数字人技术领域。该方法包括:获取第一图像文件和第一形象在目标场景的参考动作库,第一图像文件包括第二形象的2d真人照片或者第二形象的2d真人动作视频,参考动作库包括第一形象的多个2d数字人动作,基于第一图像文件和参考动作库,生成第二形象在目标场景的基础动作库,该基础动作库包括多个2d数字人动作,基础动作库中的2d数字人动作与该参考动作库中的2d数字人动作相同,基础动作库用于生成第二形象的2d数字人动作视频。采用本公开的方法,获得2d数字人动作库时能够自动获得动作库,提升2d数字人动作库的获得效率。

    一种数字人的音唇同步评测方法、装置及计算设备集群

    公开(公告)号:CN119071468A

    公开(公告)日:2024-12-03

    申请号:CN202310840758.5

    申请日:2023-07-10

    Abstract: 一种数字人的音唇同步评测方法,包括:获取用户输入的数字人视频;将数字人视频中的音频转换为第一文本,并对第一文本进行切分,得到多个子文本;确定数字人视频包含的各个子视频中数字人的嘴型和相应的子视频中音频之间的匹配程度,得到多个音唇同步准确率,其中,一个音唇同步准确率与一个子视频关联;基于子文本的时间戳和音唇同步准确率对应的子视频的时间戳,在时间上将各个子文本与各个音唇同步准确率对齐,得到各个子文本对应的音唇同步准确率;输出各个子文本对应的音唇同步准确率。这样,用户可以通过各个子文本对应的音唇同步准确率,快速的定位到数字人视频中哪些部分的音唇同步需要改善,并对数字人视频制作流程进行优化。

    神经网络的训练方法及其装置、计算机设备、存储介质

    公开(公告)号:CN114819046A

    公开(公告)日:2022-07-29

    申请号:CN202110124725.1

    申请日:2021-01-29

    Abstract: 本申请公开了一种神经网络的训练方法及其装置、计算机设备、存储介质,属于人工智能AI技术领域。该方法包括:获取训练数据集和待训练神经网络,其中,训练数据集中包括多个训练样本;利用训练数据集中的多个训练样本对待训练神经网络进行迭代训练,在迭代训练的过程中:获取第N次迭代过程中向待训练神经网络输入的训练样本,及待训练神经网络在第N次迭代过程中针对训练样本的输出结果,其中,N为正整数;基于第N次迭代过程中的训练样本和输出结果,确定第N次迭代过程中使用的动量系数;基于动量系数,在第N次迭代过程中对待训练神经网络的参数进行更新。本申请提高了对神经网络进行训练的训练效率。

    一种多集群参数同步方法及装置
    26.
    发明公开

    公开(公告)号:CN114765615A

    公开(公告)日:2022-07-19

    申请号:CN202011601441.9

    申请日:2020-12-30

    Abstract: 一种多集群参数同步方法及装置,用于解决现有技术中单一集群无法满足当前较大规模训练作业的需求的问题。在本申请中包括N轮集群间同步;其中,N轮集群间同步中的第I轮集群间同步,包括:第一同步节点获取m个集群分别对应的待同步参数,任一集群对应的待同步参数是该集群根据第I‑1轮集群间同步后的参数确定的,m个集群包括第一集群和m‑1个第二集群,第一集群是m个集群中的任一个,第一同步节点是第一集群中n个计算节点的任一个;第一同步节点根据m个集群分别对应的待同步参数,确定第I轮集群间同步后的参数,m、n均为大于1的正整数,N、I均为大于0的正整数。

Patent Agency Ranking