-
公开(公告)号:CN115938392A
公开(公告)日:2023-04-07
申请号:CN202211425449.3
申请日:2022-11-14
Applicant: 科大讯飞股份有限公司
Abstract: 本申请公开了一种问答口语检测方法及相关装置、电子设备、存储介质,其中,问答口语检测方法包括:识别目标对象对测试问题的回答语音,得到第一音素序列;基于第一音素序列分别与各个第二音素序列的匹配结果,选择第二音素序列作为目标音素序列;获取目标音素序列变换为第一音素序列的编辑操作序列,并获取目标音素序列的关键标识序列;其中,关键标识序列包含目标音素序列中各个音素的第一标识符,且第一标识符表征音素是否属于目标音素序列所属参考答案中标注的关键词;基于回答语音、目标音素序列、编辑操作序列和关键标识序列进行检测,得到目标对象的口语检测结果。上述方案,能够提升问答口语检测的准确性。
-
公开(公告)号:CN118173118A
公开(公告)日:2024-06-11
申请号:CN202410159178.4
申请日:2024-02-04
Applicant: 科大讯飞股份有限公司
Abstract: 本申请提供了一种口语问答评分方法、装置、设备、存储介质及程序产品,该方法包括:获取目标作答音频的声学特征和所述目标作答音频对应的属性信息,所述属性信息至少包括题目信息;根据所述声学特征和所述题目信息,对所述目标作答音频进行识别,得到识别结果,所述识别结果至少包括所述目标作答音频对应的转写文本;根据所述识别结果,确定对所述目标作答音频的评分。本申请在对目标作答音频进行识别时,通过对目标作答音频对应的声学特征和题目信息进行分析,生成目标作答音频对应的识别结果,充分利用了作答题目的先验信息,提高了音频转写的准确率,进而增加了对目标作答音频的评分的准确性和可靠性。
-
公开(公告)号:CN114155834A
公开(公告)日:2022-03-08
申请号:CN202111432141.7
申请日:2021-11-29
Applicant: 科大讯飞股份有限公司
Abstract: 本申请提出一种语音识别方法、装置、设备及存储介质,该方法包括:获取编码器对待识别语音的声学特征进行编码得到的编码特征;其中,所述编码器根据对语音样本的第一识别结果以及所述语音样本的文本标签训练得到,所述语音样本的第一识别结果,根据所述编码器对语音样本的声学特征进行编码得到的编码特征,以及语音样本的识别结果对所述编码器输出的各帧编码特征的注意力系数而确定;根据所述待识别语音的编码特征,确定对所述待识别语音的语音识别结果。采用上述技术方案能够提高语音识别准确度。
-
公开(公告)号:CN118841002B
公开(公告)日:2024-12-31
申请号:CN202411319690.7
申请日:2024-09-23
Applicant: 科大讯飞股份有限公司
Abstract: 本申请提供了一种音频作答评分方法、装置、设备、存储介质及产品,该方法包括:获取目标作答音频以及第一任务指令,所述第一任务指令包括评分任务的描述信息、所述目标作答音频对应的题目信息以及评分规则;将所述目标作答音频以及所述第一任务指令输入预先训练的多模态大语言模型,多模态大语言模型输出对所述目标作答音频的评分结果;所述多模态大语言模型通过执行第一训练任务和第二训练任务得到,所述第一训练任务用于基于第一样本作答音频的转写文本对所述第一样本作答音频进行评分,所述第二训练任务用于通过对所述第一样本作答音频进行处理确定对所述第一样本作答音频的评分,所述第一训练任务的评分结果作为所述第二训练任务的评分标签。
-
公开(公告)号:CN118658467B
公开(公告)日:2024-11-05
申请号:CN202411154397.X
申请日:2024-08-22
Applicant: 科大讯飞股份有限公司
Abstract: 本申请提供了一种作弊检测方法、装置、设备、存储介质及产品,该方法包括:获取目标作答音频以及第一指示信息,所述第一指示信息包括作弊检测任务的任务信息以及作弊判断规则,所述作弊检测任务用于对所述目标作答音频进行作弊检测,确定作弊检测结果;确定所述目标作答音频在语义空间中的第一特征表示;将所述第一特征表示以及所述第一指示信息输入至预先训练的大语言模型中,由所述大语言模型根据所述第一特征表示以及所述第一指示信息,确定所述目标作答音频对应的作弊检测结果。本申请不仅能够精准识别目标作答音频中的作弊行为,实现对作弊行为的准确检测,还能够适应不同的作答场景和作弊手段,提高作弊检测的适应性和鲁棒性。
-
公开(公告)号:CN118841002A
公开(公告)日:2024-10-25
申请号:CN202411319690.7
申请日:2024-09-23
Applicant: 科大讯飞股份有限公司
Abstract: 本申请提供了一种音频作答评分方法、装置、设备、存储介质及产品,该方法包括:获取目标作答音频以及第一任务指令,所述第一任务指令包括评分任务的描述信息、所述目标作答音频对应的题目信息以及评分规则;将所述目标作答音频以及所述第一任务指令输入预先训练的多模态大语言模型,多模态大语言模型输出对所述目标作答音频的评分结果;所述多模态大语言模型通过执行第一训练任务和第二训练任务得到,所述第一训练任务用于基于第一样本作答音频的转写文本对所述第一样本作答音频进行评分,所述第二训练任务用于通过对所述第一样本作答音频进行处理确定对所述第一样本作答音频的评分,所述第一训练任务的评分结果作为所述第二训练任务的评分标签。
-
公开(公告)号:CN118658467A
公开(公告)日:2024-09-17
申请号:CN202411154397.X
申请日:2024-08-22
Applicant: 科大讯飞股份有限公司
Abstract: 本申请提供了一种作弊检测方法、装置、设备、存储介质及产品,该方法包括:获取目标作答音频以及第一指示信息,所述第一指示信息包括作弊检测任务的任务信息以及作弊判断规则,所述作弊检测任务用于对所述目标作答音频进行作弊检测,确定作弊检测结果;确定所述目标作答音频在语义空间中的第一特征表示;将所述第一特征表示以及所述第一指示信息输入至预先训练的大语言模型中,由所述大语言模型根据所述第一特征表示以及所述第一指示信息,确定所述目标作答音频对应的作弊检测结果。本申请不仅能够精准识别目标作答音频中的作弊行为,实现对作弊行为的准确检测,还能够适应不同的作答场景和作弊手段,提高作弊检测的适应性和鲁棒性。
-
公开(公告)号:CN118553246A
公开(公告)日:2024-08-27
申请号:CN202410185012.X
申请日:2024-02-19
Applicant: 科大讯飞股份有限公司
IPC: G10L15/26 , G10L15/18 , G10L15/14 , G06F40/279
Abstract: 本申请公开了一种口语答题检测方法及相关装置、设备和存储介质,其中,口语答题检测方法包括:基于目标对象对目标题目进行口语作答的回答语音进行识别,得到语音识别文本,并基于目标题目的题目类型,获取用于检测口语作答的参考文本集合;基于语音识别文本和参考文本集合,构造提示文本;其中,提示文本至少用于指示人工智能模型基于参考文本集合诊断语音识别文本对目标题目的作答得失;将提示文本输入至人工智能模型,并获取人工智能模型依提示文本所指示而输出的目标检测结果;其中,目标检测结果至少包括反映作答得失的目标分析文本。上述方案,能够提升口语答题的检测效率、准确性和完备性,以提高口语答题检测结果的参考意义。
-
公开(公告)号:CN117877483A
公开(公告)日:2024-04-12
申请号:CN202311745175.0
申请日:2023-12-18
Applicant: 科大讯飞股份有限公司
Abstract: 本申请公开了一种口语评分模型的训练方法,该方法包括获取语音识别数据,所述语音识别数据包括语音模态数据与其对应的文本模态数据;利用所述语音识别数据对初始口语评分模型进行预训练,其中,所述初始口语评分模型包括声学编码器和文本编码器,预训练后的所述声学编码器对应的语音模态和预训练后的所述文本编码器对应的文本模态对齐;获取口语评测数据;利用所述口语评测数据对预训练后的所述初始口语评分模型进行模型优化,得到目标口语评分模型。本申请还公开了口语评分方法以及相关设备。本申请提高了自动口语评估的效率与准确度。
-
公开(公告)号:CN115910108A
公开(公告)日:2023-04-04
申请号:CN202211429640.5
申请日:2022-11-15
Applicant: 科大讯飞股份有限公司
Abstract: 本申请公开了一种发音检测方法及相关装置、电子设备、存储介质,其中,发音检测方法包括:获取受测对象朗读目标文本所采集到的测试语音,并获取目标文本进行音素转换所得到的音素序列;其中,测试语音包含若干音频帧;提取音素序列中各个音素的音素特征,得到第一音素特征序列,并确定多种下采样率;对于各种下采样率,基于下采样率对若干音频帧进行编码,得到对应下采样率的韵律特征序列;对于各种下采样率分别对应的韵律特征序列,基于第一音素特征序列与韵律特征序列进行融合,得到第二音素特征序列;基于各个第二音素特征序列进行预测,得到测试语音的发音分值。上述方案,能够提升发音检测的准确性。
-
-
-
-
-
-
-
-
-