-
公开(公告)号:CN119830926A
公开(公告)日:2025-04-15
申请号:CN202411940917.X
申请日:2024-12-26
Applicant: 科大讯飞股份有限公司
IPC: G06F40/58 , G06F40/232 , G06N3/0455 , G10L15/26
Abstract: 本申请公开了一种语音翻译方法及相关装置、设备和存储介质,其中,语音翻译方法包括:获取待翻译语音的若干初始识别文本和用于指示翻译的思维链;利用大语言模型按照思维链处理若干初始识别文本,得到待翻译语音的最终翻译文本;其中,思维链至少包括:基于若干初始识别文本进行错误校正,得到语音识别文本,并基于语音识别文本翻译为目标语种,得到第一翻译文本,基于第一翻译文本翻译为待翻译语音的源语种,得到第二翻译文本,以及至少基于第二翻译文本和语音识别文本之间差异修正第一翻译文本,得到最终翻译文本。上述方案,能够提升大语言模型实现语音翻译的准确性,特别是在数据资源限制的情况下。
-
公开(公告)号:CN119917617A
公开(公告)日:2025-05-02
申请号:CN202411970420.2
申请日:2024-12-30
Applicant: 科大讯飞股份有限公司
IPC: G06F16/3329 , G06F16/3332 , G06F16/334 , G06F18/214 , G06N5/04
Abstract: 本申请提供一种多语种微调数据生成方法、装置、设备、介质及程序产品,该多语种微调数据生成方法包括:基于预设语种的原始问题,改写生成第一问题;其中,第一问题用多语种表示;基于第一问题,改写生成第二问题;其中,第二问题用多语种表示;基于第一问题和第二问题,确定目标问题;其中,目标问题用多语种表示;生成目标问题对应的目标回答;基于目标问题和目标回答,生成多语种微调数据。本申请能够自动生成多样性的多语种微调数据。
-