-
公开(公告)号:CN119864026A
公开(公告)日:2025-04-22
申请号:CN202411972326.0
申请日:2024-12-30
Applicant: 科大讯飞股份有限公司
Abstract: 本说明书实施例提供了一种语音识别方法,该方法通过对第一语音信息进行语音识别,以确定第一语音信息对应的目标用户以及语音场景;然后基于语音场景对目标用户对应的黑白名单进行配置,该黑白名单用于对语音结束值进行调整;并响应于第二语音信息的触发,根据黑白名单对名单资源进行更新;进而通过更新后的名单资源确定第二语音信息对应的语音结束值,以基于语音结束值对第二语音信息进行识别。从而实现个性化的语音结束值配置过程,由于结合用户的语音特征进行黑白名单配置,并通过黑白名单进行名单资源的维护,使得语音结束值可以适配于不同的用户,提高用户语音输入后内容的完整性,提高语音识别的准确性。
-
公开(公告)号:CN119830925A
公开(公告)日:2025-04-15
申请号:CN202411940911.2
申请日:2024-12-26
Applicant: 科大讯飞股份有限公司
Abstract: 本申请公开了一种语音翻译方法及相关装置、设备和存储介质,其中,语音翻译方法包括:获取待翻译语音的识别结果;其中,识别结果包括:与待翻译语音中各个语音帧的音频特征分别对齐的识别字符和发音单元;基于识别结果进行分析,选择语音帧作为语义分割点;其响应于历史分割点之后检测到句末分割点,基于历史分割点之后最新句末分割点,确定目标分割点,并以不晚于历史分割点的语义分割点为本次分割的起始位置且以目标分割点为本次分割的结束位置,组合音频特征作为特征集合,以及基于特征集合,翻译得到翻译文本;其中,历史分割点为上次分割时作为结束位置的语义分割点。上述方案,能够提升语音翻译的实时性和准确性。
-
公开(公告)号:CN119785771A
公开(公告)日:2025-04-08
申请号:CN202411940606.3
申请日:2024-12-26
Applicant: 科大讯飞股份有限公司
Abstract: 本发明涉及计算机技术领域,提供一种解码网络的插词方法、装置、电子设备和存储介质,方法包括:确定待插入槽及其对应的候选词;在所述待插入槽包括重复出现的多个相同槽的情况下,将所述多个相同槽对应的候选词复用为同一个候选词节点;将所述候选词节点与所述多个相同槽的端点连接,得到插词后的解码网络。本发明提供的解码网络的插词方法、装置、电子设备和存储介质,在待插入槽包括重复出现的多个相同槽的情况下,将该重复出现的多个相同槽对应的候选词复用为同一个候选词节点,即只需要构建一次候选词,相比于现有技术中对每一个槽就需要进行一次候选词的插入,需要重复构建多次候选词,减少了插词的时间开销,同时降低了新增的内存占用。
-
公开(公告)号:CN110322884A
公开(公告)日:2019-10-11
申请号:CN201910614108.2
申请日:2019-07-09
Applicant: 科大讯飞股份有限公司
IPC: G10L15/28
Abstract: 本申请提供了一种解码网络的插词方法、装置、设备及存储介质,方法包括:获取目标词条集合,目标词条集合包括至少一条待插入词条;将目标词条集合中的词条拓展成三音素级网络,作为待插入三音素级网络;将待插入三音素级网络插入作为解码网络的目标三音素级网络,获得插词后的解码网络。本申请提供的方法可实现在用于语音识别的解码网络中插入词条,且本申请提供的方法内存占用小,插词效率高,用户体验较好。
-
-
-