渲染显示方法、装置、电子设备及存储介质

    公开(公告)号:CN118071910A

    公开(公告)日:2024-05-24

    申请号:CN202410266924.X

    申请日:2024-03-08

    IPC分类号: G06T15/00 G06T1/20 A63F13/52

    摘要: 本申请提供一种渲染显示方法、装置、电子设备及存储介质,涉及游戏技术领域。本方案主要将当前帧的下一帧的位移的求解问题转化为一个优化问题,即主要是采用预条件非线性共轭梯度法,对获取到的当前帧的位移、速度以及所受的外力进行多次迭代求解,得到当前帧的下一帧的位移变化信息,且由于非线性共轭梯度法收敛速度与拟牛顿法接近,但是其计算复杂度远小于拟牛顿法,且天然适合使用GPU并行加速计算,极大地减少了计算量,实现了实时模拟大规模物体的弹性形变,解决了现有技术中存在资源耗费大以及耗时过长的问题。

    歌声数据的标注方法及装置、电子设备、存储介质

    公开(公告)号:CN116704982A

    公开(公告)日:2023-09-05

    申请号:CN202210179525.0

    申请日:2022-02-25

    IPC分类号: G10H1/40 G10H1/00

    摘要: 本申请提供一种歌声数据的标注方法及装置、电子设备、存储介质,该方法包括:获取待标注的歌声音频数据;对所述歌声音频数据进行处理,得到每个节拍点的时间信息;根据每个节拍点的时间信息,通过算法模块对所述歌声音频数据进行处理,得到编曲结构信息、歌词预标注结果以及音高预标注结果;根据所述编曲结构信息、所述歌词预标注结果以及所述音高预标注结果得到所述歌声音频数据的结构化标注数据。该方案降低了人工标注难度,减少人工标注的人力和时间成本。

    音频处理模型的训练方法、音频转换方法及装置

    公开(公告)号:CN116631421A

    公开(公告)日:2023-08-22

    申请号:CN202310576603.5

    申请日:2023-05-19

    IPC分类号: G10L21/013 G10L25/03

    摘要: 本申请提供了一种音频处理模型的训练方法、音频转换方法、装置、电子设备及计算机可读存储介质,训练方法包括:确定样本音频数据的样本发音特征;将样本发音特征输入第一待训练模型进行数值化编码得到数值化的第一输出特征,第一待训练模型为基于过去的信息对数据进行数值化编码的模型;将样本发音特征输入第二模型进行数值化编码得到数值化的第二输出特征,第二模型为基于过去和未来的信息对数据进行处理的模型;基于减小第一输出特征与第二输出特征之间的差别的第一参数调整原则,对第一待训练模型进行参数调整,得到调整后第一模型;根据调整后第一模型确定音频处理模型。如此,使得流式歌声转换能够实现流式推理的同时保证了流式推理的效果。

    一种游戏语音处理方法、装置、计算机设备及存储介质

    公开(公告)号:CN116999800A

    公开(公告)日:2023-11-07

    申请号:CN202310796771.5

    申请日:2023-06-30

    IPC分类号: A63F13/424 A63F13/63

    摘要: 本申请实施例公开了一种游戏语音处理方法、装置、计算机设备及计算机可读存储介质。本方案通过在游戏中设计技能语音设置界面,该语音设置界面可以包括游戏技能展示区域和技能语音展示区域,当检测到游戏玩家在游戏技能展示区域中对目标游戏技能的选择操作,在技能语音展示区域展示该目标游戏技能已配置的多条技能语音,同时在技能语音展示区域提供一语音编辑控件,通过对语音编辑控件的触控操作,显示语音编辑页面,根据游戏玩家在语音编辑页面的自定义语音配置操作,生成目标游戏技能的技能语音,以满足游戏玩家的个性化语音配置需求,从而提高玩家游戏体验。

    语音数据的处理方法、装置、电子设备和可读存储介质

    公开(公告)号:CN116564269A

    公开(公告)日:2023-08-08

    申请号:CN202310595157.2

    申请日:2023-05-24

    摘要: 本公开提供了一种语音数据的处理方法、装置、电子设备和可读存储介质。其中,方法包括:获取目标说话人的人声标签和文本数据;将人声标签输入预先训练完成的音色生成模型,生成目标说话人的目标人声表征向量,其中,音色生成模型根据对多维先验概率分布进行采样的采样结果与人声标签生成目标人声表征向量;将目标人声表征向量和文本数据输入预先训练完成的语音合成模型,生成目标说话人的语音数据。该方式中,通过音色生成模型可以分类生成不同类型的人声和音色的目标人声表征向量;通过语音合成模型可以生成目标说话人的语音数据,从而控制目标说话人的语音数据的音色特点,提高说话人音色生成的可控性。

    文本对齐信息获取方法、装置及计算机设备

    公开(公告)号:CN116229979A

    公开(公告)日:2023-06-06

    申请号:CN202310173500.4

    申请日:2023-02-17

    摘要: 本申请提供一种文本对齐信息获取方法、装置及计算机设备,方法包括:获取目标文本的音素序列信息,以及与目标文本关联的音频信息;基于音素序列信息和音频信息,确定音素序列信息中的各个音素的音素边界信息,以及音频信息中的静音段信息;其中,静音段信息包括已知标点的第一静音边界信息、未知标点的第二静音边界信息;分析静音段信息,以对音素边界信息和静音段信息进行边界修正,得到各音素的第一发音时长,以及各已知标点的第二发音时长;基于第一发音时长和第二发音时长,对第一静音边界信息、第二静音边界信息添加预设的韵律标签,得到目标文本的对齐信息。采用本方法,能够有效改善对齐效果的可靠性,得到准确率较高的文本对齐信息。