语音翻译方法、电子设备及计算机可读存储介质

    公开(公告)号:CN119400169A

    公开(公告)日:2025-02-07

    申请号:CN202411493813.9

    申请日:2024-10-24

    Abstract: 本申请公开了一种语音翻译方法、电子设备及计算机可读存储介质。其中,方法包括:获取音频片段;对音频片段进行表征提取,得到音频片段的多个初始高阶语音表征,并对各初始高阶语音表征进行音素分类,确定初始音素集;利用基于专有词汇偏置列表构建得到的目标数据库中的各专有词汇音素集匹配初始音素集中的音素,得到音频片段中的至少一个目标专有词汇的目标高阶语音表征;替换目标专有词汇的初始高阶语音表征为目标高阶语音表征,形成音频片段的高阶语音表征集;对高阶语音表征集进行翻译,得到音频片段的目标翻译文本。借助音素级专有词汇激励可以缓解语音翻译任务中不同应用场景下由于发音和口音差异带来的泛化性问题。

Patent Agency Ranking