一种将白话文转换成语音的方法、装置及介质

    公开(公告)号:CN118609541A

    公开(公告)日:2024-09-06

    申请号:CN202410809624.1

    申请日:2024-06-21

    发明人: 杨明 王浩 薛富恩

    摘要: 本发明公开了一种将白话文转换成语音的方法、装置及介质。其中,方法包括:收集语音数据,形成语音数据池,其中语音数据包括:不同性别、不同年龄以及不同口音的语音数据;根据语音数据池训练深度学习算法,生成普通话语音合成模型以及语音合成模型;将输入的待转换白话文字转换成拼音数据;将拼音数据输入至普通话语音合成模型中,生成与待转换白话文字对应的语音信号;对语音信号进行参数调整,确定修正语音信号;将修正语音信号输入至语音合成模型中,输出待转换白话文的标准语音数据。

    具有语音检测周期持续时间补偿的音频传送方法和设备

    公开(公告)号:CN109644192B

    公开(公告)日:2022-03-08

    申请号:CN201780052227.2

    申请日:2017-08-25

    IPC分类号: G10L21/043 G10L25/87

    摘要: 一种计算机实现的技术可以包括在第一和第二计算设备之间建立音频通信会话,以及由第一计算设备使用由麦克风捕捉的音频数据来获得音频输入信号。第一计算设备可以分析音频输入信号以检测其第一用户的语音输入,以及可以确定从音频输入信号被获得直到分析已经完成的检测周期的持续时间。然后,第一计算设备可以向第二计算设备传送(i)在语音输入开始时开始的音频输入信号的部分和(ii)检测周期持续时间,其中音频输入信号的部分和检测周期持续时间的接收使得第二计算设备加速音频输入信号的部分的重放,以补偿检测周期持续时间。

    一种语音识别方法及装置
    7.
    发明公开

    公开(公告)号:CN112599148A

    公开(公告)日:2021-04-02

    申请号:CN202011624401.6

    申请日:2020-12-31

    摘要: 本发明适用于语音识别技术领域,提供了一种语音识别方法及装置,该方法包括:对获取的第一音频数据进行语速识别,获取所述第一音频数据的初始语速;基于基准语速和所述初始语速,对所述第一音频数据进行语音变速处理,获得调整后的第二音频数据,所述第二音频数据的语速与所述基准语速一致;对所述第二音频数据进行语音识别,获取语音识别结果。本发明通过对音频数据的语速进行调整后再进行语音识别,由于音频数据的语速与基准语速一致,因此可以极大减少语音识别模型的训练数据,从而节省音频数据资源和训练时间成本。

    语音交互及车载语音交互方法、装置、设备及存储介质

    公开(公告)号:CN111724774A

    公开(公告)日:2020-09-29

    申请号:CN201910223485.3

    申请日:2019-03-22

    发明人: 罗婷

    摘要: 本公开提出了一种语音交互方法、装置、设备及存储介质。接收用户的第一语音信息;根据第一语音信息的第一特征,调整输出的第二语音信息的第二特征。例如,可以根据第一语音信息的语义密度,调整与输出的第二语音信息相关的参数,其中,语义密度用于表征第一语音信息在单位时间内传达的语义信息量。由此,可以为良好的语音交互体验提供技术支持。