-
公开(公告)号:CN118071910A
公开(公告)日:2024-05-24
申请号:CN202410266924.X
申请日:2024-03-08
申请人: 网易(杭州)网络有限公司
摘要: 本申请提供一种渲染显示方法、装置、电子设备及存储介质,涉及游戏技术领域。本方案主要将当前帧的下一帧的位移的求解问题转化为一个优化问题,即主要是采用预条件非线性共轭梯度法,对获取到的当前帧的位移、速度以及所受的外力进行多次迭代求解,得到当前帧的下一帧的位移变化信息,且由于非线性共轭梯度法收敛速度与拟牛顿法接近,但是其计算复杂度远小于拟牛顿法,且天然适合使用GPU并行加速计算,极大地减少了计算量,实现了实时模拟大规模物体的弹性形变,解决了现有技术中存在资源耗费大以及耗时过长的问题。
-
公开(公告)号:CN116704982A
公开(公告)日:2023-09-05
申请号:CN202210179525.0
申请日:2022-02-25
申请人: 网易(杭州)网络有限公司
摘要: 本申请提供一种歌声数据的标注方法及装置、电子设备、存储介质,该方法包括:获取待标注的歌声音频数据;对所述歌声音频数据进行处理,得到每个节拍点的时间信息;根据每个节拍点的时间信息,通过算法模块对所述歌声音频数据进行处理,得到编曲结构信息、歌词预标注结果以及音高预标注结果;根据所述编曲结构信息、所述歌词预标注结果以及所述音高预标注结果得到所述歌声音频数据的结构化标注数据。该方案降低了人工标注难度,减少人工标注的人力和时间成本。
-
公开(公告)号:CN116631421A
公开(公告)日:2023-08-22
申请号:CN202310576603.5
申请日:2023-05-19
申请人: 网易(杭州)网络有限公司
IPC分类号: G10L21/013 , G10L25/03
摘要: 本申请提供了一种音频处理模型的训练方法、音频转换方法、装置、电子设备及计算机可读存储介质,训练方法包括:确定样本音频数据的样本发音特征;将样本发音特征输入第一待训练模型进行数值化编码得到数值化的第一输出特征,第一待训练模型为基于过去的信息对数据进行数值化编码的模型;将样本发音特征输入第二模型进行数值化编码得到数值化的第二输出特征,第二模型为基于过去和未来的信息对数据进行处理的模型;基于减小第一输出特征与第二输出特征之间的差别的第一参数调整原则,对第一待训练模型进行参数调整,得到调整后第一模型;根据调整后第一模型确定音频处理模型。如此,使得流式歌声转换能够实现流式推理的同时保证了流式推理的效果。
-
公开(公告)号:CN116999800A
公开(公告)日:2023-11-07
申请号:CN202310796771.5
申请日:2023-06-30
申请人: 网易(杭州)网络有限公司
IPC分类号: A63F13/424 , A63F13/63
摘要: 本申请实施例公开了一种游戏语音处理方法、装置、计算机设备及计算机可读存储介质。本方案通过在游戏中设计技能语音设置界面,该语音设置界面可以包括游戏技能展示区域和技能语音展示区域,当检测到游戏玩家在游戏技能展示区域中对目标游戏技能的选择操作,在技能语音展示区域展示该目标游戏技能已配置的多条技能语音,同时在技能语音展示区域提供一语音编辑控件,通过对语音编辑控件的触控操作,显示语音编辑页面,根据游戏玩家在语音编辑页面的自定义语音配置操作,生成目标游戏技能的技能语音,以满足游戏玩家的个性化语音配置需求,从而提高玩家游戏体验。
-
公开(公告)号:CN116564269A
公开(公告)日:2023-08-08
申请号:CN202310595157.2
申请日:2023-05-24
申请人: 网易(杭州)网络有限公司
摘要: 本公开提供了一种语音数据的处理方法、装置、电子设备和可读存储介质。其中,方法包括:获取目标说话人的人声标签和文本数据;将人声标签输入预先训练完成的音色生成模型,生成目标说话人的目标人声表征向量,其中,音色生成模型根据对多维先验概率分布进行采样的采样结果与人声标签生成目标人声表征向量;将目标人声表征向量和文本数据输入预先训练完成的语音合成模型,生成目标说话人的语音数据。该方式中,通过音色生成模型可以分类生成不同类型的人声和音色的目标人声表征向量;通过语音合成模型可以生成目标说话人的语音数据,从而控制目标说话人的语音数据的音色特点,提高说话人音色生成的可控性。
-
公开(公告)号:CN116013336A
公开(公告)日:2023-04-25
申请号:CN202211599936.1
申请日:2022-12-12
申请人: 网易(杭州)网络有限公司
IPC分类号: G10L21/003 , G10L21/007 , G10L25/18
摘要: 本申请提供一种音色转换方法、装置、电子设备及存储介质,所述方法包括:获取第一音频数据,并提取所述第一音频数据的语音频域特征;根据所述语音频域特征得到所述第一音频数据的语义特征向量;将所述语义特征向量以及预先确定的第二音色数据输入到预先构建的音色转换模型中,得到具有目标音色的语音特征向量;根据所述语音特征向量,生成第二语音数据;其中,所述第二语音数据与所述第一语音数据的音色不同。
-
公开(公告)号:CN115910083A
公开(公告)日:2023-04-04
申请号:CN202211329075.5
申请日:2022-10-27
申请人: 网易(杭州)网络有限公司
IPC分类号: G10L21/007 , G10L15/18 , G10L15/06 , G10L15/16 , G10L15/02 , G10L13/04 , G10L13/047 , G10L25/30 , G10L25/03
摘要: 本申请提供了一种实时语音转换方法、装置、电子设备及介质,方法包括以下步骤:从实时录制的源说话对象的语音数据中,截取出满足语音分段条件的第一语音数据;处理所述第一语音数据提取出第一语义信息;将第一语义信息输入到预先训练好的语音转换模型中,并通过所述语音转换模型对第一语义信息和第一语音数据之前历史语音数据的有效信息进行转换处理,得到对应第一语义信息和目标说话对象语音因素的目标语音特征信息;将目标语音特征信息进行重构,得到所述第一语音数据转换后的第二语音数据,从而实现低延迟的流式推理,实现低延迟、高性能的实时语音转化。
-
公开(公告)号:CN117830081A
公开(公告)日:2024-04-05
申请号:CN202311862079.4
申请日:2023-12-29
申请人: 网易(杭州)网络有限公司
IPC分类号: G06T3/04 , G06T11/00 , G06T15/02 , G06V40/16 , G06V40/18 , G06N3/0475 , G06N3/0464 , A63F13/63 , A63F13/822
摘要: 本申请公开了一种虚拟对象的妆容生成方法、装置、电子设备和计算机可读存储介质,本申请实施例通过获取妆容参考图像,妆容参考图像中的参考对象具有待模拟的目标参考妆容;基于妆容参考图像,识别参考对象在预设的各妆容构成要素下的目标要素类型参数,以及确定目标参考妆容在目标要素类型参数下的多个目标妆容属性参数,其中,目标要素类型参数指示在对应的妆容构成要素的多种要素类型下的目标参考妆容对应的要素类型;获取待更新妆容的目标虚拟对象;基于目标要素类型参数,以及目标要素类型参数对应的目标妆容属性参数,为目标虚拟对象定制各妆容构成要素对应的目标妆容。本申请实施例可以提高虚拟对象的妆容生成效率。
-
公开(公告)号:CN116229979A
公开(公告)日:2023-06-06
申请号:CN202310173500.4
申请日:2023-02-17
申请人: 网易(杭州)网络有限公司
摘要: 本申请提供一种文本对齐信息获取方法、装置及计算机设备,方法包括:获取目标文本的音素序列信息,以及与目标文本关联的音频信息;基于音素序列信息和音频信息,确定音素序列信息中的各个音素的音素边界信息,以及音频信息中的静音段信息;其中,静音段信息包括已知标点的第一静音边界信息、未知标点的第二静音边界信息;分析静音段信息,以对音素边界信息和静音段信息进行边界修正,得到各音素的第一发音时长,以及各已知标点的第二发音时长;基于第一发音时长和第二发音时长,对第一静音边界信息、第二静音边界信息添加预设的韵律标签,得到目标文本的对齐信息。采用本方法,能够有效改善对齐效果的可靠性,得到准确率较高的文本对齐信息。
-
公开(公告)号:CN115985287A
公开(公告)日:2023-04-18
申请号:CN202211514748.4
申请日:2022-11-29
申请人: 网易(杭州)网络有限公司
摘要: 本申请提供一种语音合成方法、装置、设备及存储介质,涉及语音合成技术领域。该方法包括:获取目标文本对应的梅尔语谱图;根据所述梅尔语谱图以及所述梅尔语谱图对应的随机相位谱,生成条件音频;采用预设声码器,根据所述条件音频和所述梅尔语谱图,生成所述目标文本对应的目标音频。相对于现有技术,避免了声码器生成的音频中存在伪影的问题。
-
-
-
-
-
-
-
-
-