一种语音信号合成方法、装置、电子设备及存储介质

    公开(公告)号:CN117153142A

    公开(公告)日:2023-12-01

    申请号:CN202311101067.X

    申请日:2023-08-29

    Abstract: 本发明公开了一种语音信号合成方法、装置、电子设备及存储介质。该方法包括:对输入文本进行正则化处理;将输入文本输入至经过训练的多任务模型;通过声学模型,根据音素序列和韵律结构特征的拼接结果预测语音的声音成分;通过声码器基于声音成分合成语音信号。上述技术方案,通过多任务模型基于指令集将输入文本转换为对应的韵律结构特征和音素序列,最后通过声学模型和声码器将音素序列和韵律结构特征合成语音信号,避免了为每个任务单独构建多任务模型,从而降低了多任务模型的复杂度,增强了文本转音素的精度和质量,提高了语音信号合成的处理效率和准确性,有助于在多语言场景中更加准确地预测出语音信号合成中的发音信息。

    基于声纹编码器的语音转换方法、装置、设备及介质

    公开(公告)号:CN115064177A

    公开(公告)日:2022-09-16

    申请号:CN202210669839.9

    申请日:2022-06-14

    Abstract: 本发明实施例公开了一种基于声纹编码器的语音转换方法、装置、设备及介质。其中,该方法包括:获取第一个体的音频数据;获取第二个体的声纹特征;其中,所述第二个体的声纹特征是采用预先训练的声纹编码器输出得到的;将所述第一个体的音频数据和所述声纹特征输入至预先训练的语音转换模型,以供所述语音转换模型基于所述第一个体的音频数据和所述声纹特征的编码结果,得到由第一个体到第二个体的语音转换结果。本技术方案,能够实现第一个体到第二个体的语音转换,且保留了第一个体的说话习惯,并能够实现对第一个体和第二个体的任意切换。

    车辆维修方案确定方法、装置、设备及存储介质

    公开(公告)号:CN115034409A

    公开(公告)日:2022-09-09

    申请号:CN202210612068.X

    申请日:2022-05-31

    Abstract: 本发明实施例公开了车辆维修方案确定方法、装置、设备及存储介质。该方法包括:获取目标车辆的原始故障描述数据,其中,原始故障描述数据包括车主的描述数据和/或维修人员的描述数据,将原始故障描述数据转换为满足预设要求的标准知识表示信息,其中,预设要求与预设维修知识图谱相关联,得到目标故障描述信息,将目标故障描述信息与预设维修知识图谱进行匹配,并根据匹配结果输出至少一个推荐维修方案。通过采用上述技术方案,利用车辆的故障描述数据和知识图谱可以快速输出有针对性的推荐维修方案,帮助车主或维修人员快速获知解决当前车辆故障问题的解决方式,提高车辆维修效率。

    一种基于优先搜索的手势判别方法、装置、设备及介质

    公开(公告)号:CN118799916A

    公开(公告)日:2024-10-18

    申请号:CN202410803473.9

    申请日:2024-06-20

    Abstract: 本发明公开了一种基于优先搜索的手势判别方法、装置、设备及介质。该方法包括:区域裁剪处理目标车辆对应的标准化视频中的当前标准化视频帧,得到包含至少一个手部区域的目标标准化视频帧;基于预设关键点检测网络模型对目标标准化视频帧中的目标手部区域进行关键点提取,得到关键点信息集合;基于预设优先搜索方法与预设投票方法对关键点信息集合进行筛选处理,得到关键点信息集合中的目标关键点信息队列;基于预设分类网络确定目标关键点信息队列对应的手势类别,作为目标标准化视频帧对应的目标手势识别信息。通过本发明的技术方案,能够对同一时间段内出现的多个手势中优先级较高的手势进行识别,提高了手势识别的效率及准确性。

Patent Agency Ranking