-
公开(公告)号:CN115966200A
公开(公告)日:2023-04-14
申请号:CN202211722073.2
申请日:2022-12-30
Applicant: 科大讯飞股份有限公司
Abstract: 本申请提供一种语音识别方法、装置、电子设备及存储介质,所述语音识别方法,包括:对第一语音进行音频特征提取处理,得到所述第一语音的音频特征;根据所述第一语音的音频特征,确定所述第一语音中的有效语音片段,并对所述有效语音片段进行拼接,得到第二语音;对所述第二语音进行语音识别,得到所述第二语音的文本信息。该方法摒弃了现有技术中对分割后的语音分别进行语音识别的处理方法,保证了第一语音的完整性,使得对语音信息的识别过程能够有效的结合不同语音之间的上下文联系,提高了语音识别的识别质量。
-
公开(公告)号:CN118553249A
公开(公告)日:2024-08-27
申请号:CN202411022971.6
申请日:2024-07-29
Applicant: 科大讯飞股份有限公司
Abstract: 本申请公开了一种音频识别方法、系统和相关装置,该方法包括:获取待识别音频;将所述待识别音频输入至目标识别模型,得到与所述待识别音频匹配的目标识别文本;其中,所述目标识别模型基于训练后的初始识别模型得到,所述初始识别模型包括参数共享的音频解析网络和文本解析网络,所述音频解析网络利用多个训练音频进行训练,所述文本解析网络利用多个训练文本进行训练,所述训练音频匹配有文本标签,所述训练文本匹配有类别标签。通过上述方式,本申请能够提高音频识别的准确性。
-
公开(公告)号:CN119400181A
公开(公告)日:2025-02-07
申请号:CN202411635769.0
申请日:2024-11-15
Applicant: 科大讯飞股份有限公司
Abstract: 本申请公开了一种语音识别方法及相关装置,涉及语音识别技术领域,语音识别方法包括:获取目标语音数据;通过对目标语音数据进行初步语音识别,获取目标语音数据的字级别声学信息以及候选语音识别结果;将目标语音数据的字级别声学信息投射到大语言模型的表征空间中,得到目标语音数据的目标声学特征;利用大语言模型,辅以目标语音数据的候选语音识别结果,将目标语音数据的目标声学特征处理成文字序列,得到目标语音数据的语音识别结果。本申请公开的语音识别方法具有较好的识别效果。
-
公开(公告)号:CN118553249B
公开(公告)日:2024-12-13
申请号:CN202411022971.6
申请日:2024-07-29
Applicant: 科大讯飞股份有限公司
Abstract: 本申请公开了一种音频识别方法、系统和相关装置,该方法包括:获取待识别音频;将所述待识别音频输入至目标识别模型,得到与所述待识别音频匹配的目标识别文本;其中,所述目标识别模型基于训练后的初始识别模型得到,所述初始识别模型包括参数共享的音频解析网络和文本解析网络,所述音频解析网络利用多个训练音频进行训练,所述文本解析网络利用多个训练文本进行训练,所述训练音频匹配有文本标签,所述训练文本匹配有类别标签。通过上述方式,本申请能够提高音频识别的准确性。
-
公开(公告)号:CN117609214A
公开(公告)日:2024-02-27
申请号:CN202311693991.1
申请日:2023-12-08
Applicant: 科大讯飞股份有限公司
IPC: G06F16/215 , G06F16/33 , G06F16/35 , G06F40/232 , G06F40/242 , G06F40/284 , G06F21/62
Abstract: 本申请公开了一种英文文本数据清洗方法、装置、存储介质及设备,该方法包括:首先获取待清洗的目标英文文本数据;并对其进行脱敏处理,得到脱敏后的目标英文文本数据,然后通过串并联的N个不同路径,对脱敏后的目标英文文本数据分别进行不同维度的错误信息挖掘及纠错处理,得到N个不同路径各自对应的纠错后的目标英文文本数据;接着利用预训练语言模型对目标英文文本数据和N个不同路径各自对应的纠错后的目标英文文本数据进行评分,并根据评分结果对目标英文文本数据进行清洗,得到清洗结果。从而能够在利用串并联的N个不同路径实现对于错误信息的深度挖掘和顺序多样化的多路径纠错后,准确清洗出高质量英文文本数据,提高了数据清洗效果。
-
-
-
-