-
公开(公告)号:CN117746837A
公开(公告)日:2024-03-22
申请号:CN202311869208.2
申请日:2023-12-29
Applicant: 科大讯飞股份有限公司
Abstract: 本申请实施例公开了一种朗读进度跟踪方法、装置、设备及存储介质,对朗读者朗读目标文本时的语音数据进行语音识别,得到语音识别结果及其对应的发音时长序列后,除了基于发音时长序列在目标文本中对语音识别结果进行标记外,还至少根据语音识别结果在目标文本中确定朗读者的后续朗读内容及其对应的预测发音时长序列,基于预测发音时长序列在目标文本中对后续朗读内容进行标记,从而避免仅根据语音识别结果及其对应的发音时长序列进行朗读跟踪时的标记滞后问题,实现实时的朗读进度跟踪。
-
公开(公告)号:CN114155831B
公开(公告)日:2025-03-28
申请号:CN202111476484.3
申请日:2021-12-06
Applicant: 科大讯飞股份有限公司
Abstract: 本申请公开了一种语音评测方法、相关设备及可读存储介质,在获取待评测语音之后,确定待评测语音的语言组织评估特征、音段评估特征以及跟读节奏评估特征,并根据待评测语音的语言组织评估特征、音段评估特征以及跟读节奏评估特征,确定所述待评测语音的评测结果。由于上述多个方面的特征能够表征待评测语音的发音人的多种能力,因此,该方法可以用于影子跟读法的口语评测。
-
公开(公告)号:CN119296544A
公开(公告)日:2025-01-10
申请号:CN202411557445.X
申请日:2024-11-04
Applicant: 科大讯飞股份有限公司
Abstract: 本申请公开了一种语音评测方法及相关装置,涉及语音评测技术领域,语音评测方法包括:获取待评测语音数据;将待测评测语音数据处理成音素序列,得到目标音素序列;基于大语言模型,以目标音素序列为依据,获取目标音素序列对应的文本的来源文本,得到第一溯源文本;将目标音素序列处理成若干音素子序列,通过确定每个音素子序列对应的文本的来源文本来确定目标音素序列对应的文本的来源文本,得到第二溯源文本;根据第一溯源文本和第二溯源文本分别与目标音素序列的相关程度,确定目标溯源文本;参考目标溯源文本,对待评测语音数据进行评测。本申请公开的语音评测方法参考目标溯源文本对待评测语音数据进行评测,能够获得较为准确的评测结果。
-
公开(公告)号:CN117939259A
公开(公告)日:2024-04-26
申请号:CN202311708272.2
申请日:2023-12-12
Applicant: 科大讯飞股份有限公司
IPC: H04N21/85 , H04N21/44 , H04N21/435 , H04N21/43
Abstract: 本申请公开了一种视频合成方法、装置、设备、朗读亭和存储介质,其中,视频合成方法包括:获取目标文本以及目标对象口播目标文本的目标音频;提取目标文本在目标音频中的时间戳信息,并生成与目标文本内容匹配的目标图像;基于时间戳信息,生成包含目标图像的背景视频;至少基于目标音频、背景视频和时间戳信息,生成要素信息;其中,要素信息定义有各个视频元素在目标视频的起止时间、层次位置、大小尺寸中至少一者,各个视频元素用于合成目标视频,且至少包括目标文本、目标音频和背景视频;基于各个视频元素和要素信息进行视频合成,得到目标视频。上述方案,能够在提升视频元素丰富度的同时,尽可能地确保时间同步,以增强视频合成效果。
-
公开(公告)号:CN114297399A
公开(公告)日:2022-04-08
申请号:CN202111403397.5
申请日:2021-11-24
Applicant: 科大讯飞股份有限公司
Abstract: 本发明提供一种知识图谱生成方法、系统、存储介质及电子设备,其中,所述方法包括:获取目标用户在预设时间段内的学习数据集合,所述学习数据集合包括至少一项学习数据;对所述学习数据集合中学习数据进行特征提取处理,得到目标特征向量,所述目标特征向量用于表征所述目标用户学习过的学习数据;采用经训练的神经网络模型对所述目标特征向量进行知识点分析处理,以输出所述学习数据集合对应的知识点权重;根据所述知识点权重更新所述目标用户的知识图谱,并输出更新后的目标知识图谱。本发明可通过神经网络模型生成知识图谱,由此满足目标用户的个性化学习需求并显著减少了人工工作量。
-
公开(公告)号:CN114297399B
公开(公告)日:2024-11-08
申请号:CN202111403397.5
申请日:2021-11-24
Applicant: 科大讯飞股份有限公司
IPC: G06F16/36 , G06N5/02 , G06N3/08 , G06F18/214 , G06N3/0455
Abstract: 本发明提供一种知识图谱生成方法、系统、存储介质及电子设备,其中,所述方法包括:获取目标用户在预设时间段内的学习数据集合,所述学习数据集合包括至少一项学习数据;对所述学习数据集合中学习数据进行特征提取处理,得到目标特征向量,所述目标特征向量用于表征所述目标用户学习过的学习数据;采用经训练的神经网络模型对所述目标特征向量进行知识点分析处理,以输出所述学习数据集合对应的知识点权重;根据所述知识点权重更新所述目标用户的知识图谱,并输出更新后的目标知识图谱。本发明可通过神经网络模型生成知识图谱,由此满足目标用户的个性化学习需求并显著减少了人工工作量。
-
公开(公告)号:CN114155831A
公开(公告)日:2022-03-08
申请号:CN202111476484.3
申请日:2021-12-06
Applicant: 科大讯飞股份有限公司
Abstract: 本申请公开了一种语音评测方法、相关设备及可读存储介质,在获取待评测语音之后,确定待评测语音的语言组织评估特征、音段评估特征以及跟读节奏评估特征,并根据待评测语音的语言组织评估特征、音段评估特征以及跟读节奏评估特征,确定所述待评测语音的评测结果。由于上述多个方面的特征能够表征待评测语音的发音人的多种能力,因此,该方法可以用于影子跟读法的口语评测。
-
-
-
-
-
-