-
公开(公告)号:CN117995196A
公开(公告)日:2024-05-07
申请号:CN202410033784.1
申请日:2024-01-09
Applicant: 科大讯飞股份有限公司
Abstract: 本发明提供一种文本位置匹配方法、装置、电子设备和存储介质,其中方法包括:获取待匹配文本的音频,对音频中当前时段的音频段进行发音识别,得到当前时段的识别发音;将当前时段的识别发音与发音图网络中的各节点进行匹配,得到识别发音在待匹配文本中所处位置的匹配结果,发音图网络中的各节点基于待匹配文本中各文字的发音构建;基于发音图网络,对历史匹配结果进行回溯和修正,得到文本位置匹配结果,历史匹配结果包括当前时段的匹配结果和当前时段之前时段的匹配结果。本发明提供的方法、装置、电子设备和存储介质,可以支持文本位置在线实时匹配,并支持匹配结果动态修正,从而提高文本位置匹配的准确性和稳定性。
-
公开(公告)号:CN117935863A
公开(公告)日:2024-04-26
申请号:CN202311708186.1
申请日:2023-12-12
Applicant: 科大讯飞股份有限公司
Abstract: 本申请公开了一种朗读评测方法和装置、电子设备、存储介质,该方法包括获取待评测文本的发音序列和朗读音频;其中,朗读音频是用户对待评测文本进行朗读得到;对朗读音频进行句子划分,得到各目标句子的句子朗读音频;基于各目标句子在发音序列中的句子发音序列对句子朗读音频进行评测,得到各目标句子的句子评测结果;基于各句子评测结果,得到朗读音频的目标评测结果。通过上述方式,本申请能够自动对待评测文本的朗读音频进行评测,提高评测效率和准确度。
-
公开(公告)号:CN117789756A
公开(公告)日:2024-03-29
申请号:CN202311810523.8
申请日:2023-12-25
Applicant: 科大讯飞股份有限公司
IPC: G10L25/18 , G10L25/03 , G10L25/30 , G06N3/0442
Abstract: 本发明提供一种特征提取方法、装置、电子设备和存储介质,其中方法包括:获取多帧流式数据的初始特征;逐帧对所述多帧流式数据的初始特征进行前向特征提取,得到多帧前向特征;对所述多帧流式数据的初始特征进行切分,得到多个分段帧,并对所述多个分段帧进行反向特征提取,得到多帧反向特征;将所述多帧前向特征和所述多帧反向特征进行拼接,并基于拼接后特征,确定所述多帧流式数据的目标特征。本发明提供的方法、装置、电子设备和存储介质,可以更加准确、高效地进行特征提取,提高特征的表达能力和鲁棒性。
-
-