-
公开(公告)号:CN119380726A
公开(公告)日:2025-01-28
申请号:CN202311278704.0
申请日:2023-09-28
Applicant: 华为云计算技术有限公司
Abstract: 本申请提供了一种生成语音克隆模型的方法及相关装置,方法应用于语音克隆领域,包括:获取用户通过终端设备输入的对多个参考音频的打分结果;基于多个参考音频和用户对多个参考音频的打分结果进行训练,获得声学反馈单元,声学反馈单元用于衡量用户对不同音频的听觉感受;获取用户通过终端设备输入的第一语音数据集;基于第一语音数据集和声学反馈单元,对语音克隆模型进行训练,获得语音克隆模型。在语音克隆模型训练过程中,考虑到了用户对不同音频的喜欢程度,将用户对多个参考音频的打分结果加入到语音克隆模型的训练过程中,训练获得的语音克隆模型更符合用户的使用需求,使用训练得到的语音克隆模型生成的语音更能满足用户的听觉感受。
-
公开(公告)号:CN118277228A
公开(公告)日:2024-07-02
申请号:CN202211667175.9
申请日:2022-12-23
Applicant: 华为云计算技术有限公司
IPC: G06F11/36
Abstract: 一种语音合成系统测试方法、装置及设备,本申请中,用户在需要测试语音合成系统时可以触发产生第一测试请求,第一测试请求用于请求对语音合成系统进行测试。测试装置接收用户触发的第一测试请求,分别对多个功能单元进行测试,获取多个功能单元的测试结果,生成语音合成系统的测试报告。测试装置向用户反馈语音合成系统的测试报告。通过上述方法,对于需要测试语音合成系统的用户,只需要触发第一测试请求,测试装置自行完成对对语音合成系统的测试,语音合成系统的测试的自动化程度更高,无需消耗较多人力。在对语音合成系统进行测试时,是以功能粒度进行测试,便于定位语音合成系统中出现问题的功能单元。
-
公开(公告)号:CN117373432A
公开(公告)日:2024-01-09
申请号:CN202211071940.0
申请日:2022-09-02
Applicant: 华为云计算技术有限公司
IPC: G10L13/10 , G10L13/02 , G06F16/683
Abstract: 本申请提供了一种语音克隆方法,包括:确定目标场景,并根据该目标场景,确定属于目标场景的目标语料文本,然后根据该目标语料文本,确定目标对象的音频,该音频的语音内容与目标语料文本的内容相匹配,从而利用该目标语料文本以及目标对象的音频,训练目标场景对应的语音克隆模型,该语音克隆模型用于输出模拟目标对象在目标场景下发音的音频。由于语音克隆模型是基于目标对象针对目标场景下的语料文本的发音音频进行训练得到,这使得语音克隆模型根据文本所输出的新的语音,在音色、韵律和发音风格等方面的特征,能够更加符合目标对象在目标场景下的真实发音情况,以此可以有效提高语音克隆效果。此外,本申请还提供了对应的装置及相关设备。
-
公开(公告)号:CN119814948A
公开(公告)日:2025-04-11
申请号:CN202311412575.X
申请日:2023-10-27
Applicant: 华为云计算技术有限公司
IPC: H04N5/76 , H04N5/91 , H04N21/431 , H04N21/439 , H04N21/44
Abstract: 本申请提供一种多媒体流的处理方法,包括:输出配置界面,并响应于用户在该配置界面上的操作,获取第一配置信息,该第一配置信息用于配置录制任务、检测算法、录制要求;获取该录制任务下的多媒体流,该多媒体流为对被采集对象进行视频录制得到的视频流,或者是进行语音录制得到的音频流;根据用户配置的检测算法,对多媒体流进行检测,得到检测结果,并当该检测结果不满足用户配置的录制要求时,输出针对被采集对象的录制建议。如此,通过反馈建议,能够有效提高生成符合用户预期的录制视频/音频的效率,而且,能够满足不同用户对于不同录制任务、不同检测算法、不同录制要求的差异化需求。此外,本申请还提供了对应的处理装置及相关设备。
-
公开(公告)号:CN115862584A
公开(公告)日:2023-03-28
申请号:CN202111124499.3
申请日:2021-09-24
Applicant: 华为云计算技术有限公司
IPC: G10L13/02 , G10L13/10 , G10L15/26 , G06F40/117 , G06F40/284
Abstract: 本申请实施例公开了一种韵律信息标注方法以及相关设备,用于提高标注的效率。本申请实施例方法包括:计算机设备获取音频信息以及第一文本信息。计算机设备标注第一文本信息中的韵律词以及韵律短语,得到第一标注后文本,第一标注后文本中的韵律短语需要基于所述音频信息进行。计算机设备基于第一标注后文本中标注的韵律词、第一标注后文本中标注的韵律短语以及音频信息标注第一标注后文本中的语调短语,得到第二标注后文本。
-
-
-
-