-
公开(公告)号:CN119830925A
公开(公告)日:2025-04-15
申请号:CN202411940911.2
申请日:2024-12-26
Applicant: 科大讯飞股份有限公司
Abstract: 本申请公开了一种语音翻译方法及相关装置、设备和存储介质,其中,语音翻译方法包括:获取待翻译语音的识别结果;其中,识别结果包括:与待翻译语音中各个语音帧的音频特征分别对齐的识别字符和发音单元;基于识别结果进行分析,选择语音帧作为语义分割点;其响应于历史分割点之后检测到句末分割点,基于历史分割点之后最新句末分割点,确定目标分割点,并以不晚于历史分割点的语义分割点为本次分割的起始位置且以目标分割点为本次分割的结束位置,组合音频特征作为特征集合,以及基于特征集合,翻译得到翻译文本;其中,历史分割点为上次分割时作为结束位置的语义分割点。上述方案,能够提升语音翻译的实时性和准确性。
-
公开(公告)号:CN119167101A
公开(公告)日:2024-12-20
申请号:CN202411177288.X
申请日:2024-08-26
Applicant: 科大讯飞股份有限公司
IPC: G06F18/22 , G06F18/214
Abstract: 本申请公开了一种任务处理方法、系统和相关装置,该方法包括:获取由至少一个目标任务触发的任务处理指令;将所述任务处理指令输入至智能分析模型,得到所述智能分析模型输出的与每个目标任务匹配的处理内容;其中,所述智能分析模型包括模型基础网络以及与所述模型基础网络并列的至少一个目标调节子网络,所述模型基础网络与调度模块耦接,所述调度模块用于从多个训练后的候选参数集中选取与目标任务匹配的目标参数集以构建所述目标调节子网络。通过上述方式,本申请能够提高任务处理的效率。
-
公开(公告)号:CN118484525B
公开(公告)日:2024-10-29
申请号:CN202410947840.2
申请日:2024-07-16
Applicant: 科大讯飞股份有限公司
IPC: G06F16/332 , G06F9/50
Abstract: 本申请公开了一种问答交互方法及相关装置、电子设备和存储介质,其中,问答交互方法包括:获取用户在当前轮次输入的第一语句;调用GPU计算资源处理第一语句,得到当前轮次中当前注意力特征,将外部存储空间中历史轮次的历史注意力特征,调取至GPU显存空间;调用GPU计算资源处理当前注意力特征和历史注意力特征,得到第二语句;按照生成时间由新到旧的顺序调取GPU显存空间中键特征和值特征,并写回至外部存储空间,以用于当前轮次的下一轮次。上述方案,能够提升计算资源的利用率和吐字效率,并尽可能地降低首响延迟。此外,通过异构缓存,能够大大缓解保存历史注意力特征对于GPU显存空间的需求压力,特别是在长文本的交互场景下。
-
公开(公告)号:CN118484525A
公开(公告)日:2024-08-13
申请号:CN202410947840.2
申请日:2024-07-16
Applicant: 科大讯飞股份有限公司
IPC: G06F16/332 , G06F9/50
Abstract: 本申请公开了一种问答交互方法及相关装置、电子设备和存储介质,其中,问答交互方法包括:获取用户在当前轮次输入的第一语句;调用GPU计算资源处理第一语句,得到当前轮次中当前注意力特征,将外部存储空间中历史轮次的历史注意力特征,调取至GPU显存空间;调用GPU计算资源处理当前注意力特征和历史注意力特征,得到第二语句;按照生成时间由新到旧的顺序调取GPU显存空间中键特征和值特征,并写回至外部存储空间,以用于当前轮次的下一轮次。上述方案,能够提升计算资源的利用率和吐字效率,并尽可能地降低首响延迟。此外,通过异构缓存,能够大大缓解保存历史注意力特征对于GPU显存空间的需求压力,特别是在长文本的交互场景下。
-
-
-