-
公开(公告)号:CN112668345B
公开(公告)日:2024-06-04
申请号:CN202011552924.4
申请日:2020-12-24
Applicant: 中国科学技术大学 , 科大讯飞股份有限公司
IPC: G06F40/58 , G06F40/42 , G06F40/216 , G06F40/253 , G06N3/0442 , G06N3/08
Abstract: 本申请公开了一种语法缺陷数据识别模型构建方法和语法缺陷数据识别方法,该构建方法包括:在获取到第一训练源文本、第一标准翻译文本及其对应的第一实际识别结果、和第一语法缺陷翻译文本及其对应的第二实际识别结果后,将第一训练源文本、第一标准翻译文本和第一语法缺陷翻译文本输入第一模型,得到第一标准翻译文本对应的第一预测识别结果和第一语法缺陷翻译文本对应的第二预测识别结果;再根据第一预测识别结果、第二预测识别结果、第一实际识别结果和第二实际识别结果更新第一模型,并返回执行将第一训练源文本、第一标准翻译文本和第一语法缺陷翻译文本输入第一模型的步骤,直至在达到第一停止条件时根据第一模型构建语法缺陷数据识别模型。
-
公开(公告)号:CN113838456B
公开(公告)日:2024-05-31
申请号:CN202111141351.0
申请日:2021-09-28
Applicant: 中国科学技术大学 , 科大讯飞股份有限公司
IPC: G10L15/02 , G10L15/06 , G10L15/183
Abstract: 本申请提出一种音素提取方法、语音识别方法、装置、电子设备及存储介质,该方法包括:根据待识别语音的当前待识别语音单元的声学特征,以及所述待识别语音的已识别语音单元的识别结果,预测与所述当前待识别语音单元对应的音素序列;至少根据所述当前待识别语音单元对应的音素序列,对所述当前待识别语音单元进行语音识别,得到对应所述当前待识别语音单元的语音识别结果。采用上述的技术方案,能够显著提高端侧离线语音识别的识别效果。
-
公开(公告)号:CN111460831B
公开(公告)日:2024-04-19
申请号:CN202010230897.2
申请日:2020-03-27
Applicant: 科大讯飞股份有限公司
IPC: G06F40/30 , G06F16/35 , G06F18/214
Abstract: 本申请公开了一种事件确定方法、相关设备及可读存储介质,基于上述方案,对于待进行事件确定的文本,分别基于该文本的文本级语义信息确定出该文本的事件类型,以及,基于该文本的词级语义信息确定出该文本的事件元素,该文本的事件类型及该文本的事件元素能够组成该文本所描述事件,因此,基于上述方案能够实现从文本中确定事件。
-
公开(公告)号:CN112686059B
公开(公告)日:2024-04-16
申请号:CN202011593142.5
申请日:2020-12-29
Applicant: 中国科学技术大学 , 科大讯飞股份有限公司
Abstract: 本发明提供一种文本翻译方法、装置、电子设备和存储介质,其中方法包括:确定源语言文本,以及与源语言文本相匹配的翻译文本对;将源语言文本以及翻译文本对输入至机器翻译模型,得到机器翻译模型输出的目标语言文本;机器翻译模型是基于样本源语言文本、与样本源语言文本相匹配的样本翻译文本对,以及样本源语言文本的样本目标语言文本训练得到的。本发明提供的方法、装置、电子设备和存储介质,机器翻译模型能够将翻译文本对的信息作为对源语言文本进行翻译的参考,从而优化翻译效果。且无需重新对机器翻译模型进行迭代优化,且当实际场景发生变化时,仅需累积实际场景变化后的翻译文本对即可保证机器翻译及时满足场景变化需求。
-
公开(公告)号:CN117688440A
公开(公告)日:2024-03-12
申请号:CN202311523513.6
申请日:2023-11-13
Applicant: 科大讯飞股份有限公司
IPC: G06F18/241 , G06F18/23 , G06F18/214 , G01S7/41
Abstract: 本申请公开了一种雷达信号分选方法、分选模型的训练方法及相关装置,该方法包括:将多个雷达信号进行聚类,得到离散信号集和多个聚类信号集;获取所述离散信号集中每个雷达信号与每个所述聚类信号集之间的相关距离;其中,所述相关距离表征雷达信号与所述聚类信号集的离散度,且所述相关距离与所述离散度正相关;基于所述相关距离,从所述离散信号集中确定与每个所述聚类信号集对应的参考信号集。通过上述方式,本申请能够提高对雷达信号进行分选的准确性。
-
公开(公告)号:CN116312500A
公开(公告)日:2023-06-23
申请号:CN202310312705.6
申请日:2023-03-28
Applicant: 科大讯飞股份有限公司
Abstract: 本申请涉及一种语音识别方法、装置、系统及存储介质,所述方法包括:获取待识别语音的声学特征和热词的字素向量和音素向量;基于所述声学特征得到第一编码器输出;基于所述字素向量得到第一解码器输出;基于所述字素向量和所述音素向量,利用最优化传输进行迭代更新,得到上下文词向量;基于所述第一解码器输出和所述上下文词向量得到第二解码器输出;基于所述第一编码器输出和所述上下文词向量得到第二编码器输出;基于所述第二解码器输出和所述第二编码器输出得到后验概率分布,以得到语音识别结果。本申请具有减少信息损失、提高准确性的效果。
-
公开(公告)号:CN109582977B
公开(公告)日:2023-06-02
申请号:CN201811384437.4
申请日:2018-11-20
Applicant: 科大讯飞股份有限公司
Abstract: 本申请公开了一种交互式文本翻译方法及装置,该方法包括:先获取待修正的目标文本,该目标文本是对源文本进行翻译后的文本,然后检测用户是否对该目标文本进行了人工修正,若是,则在人工修正后的文本的基础上进行自动修正,得到修正后的翻译结果。可见,本申请在人工修正文本的基础上由机器进行自动修正,当将该修正结果作为源文本的翻译结果时,与目标文本相比,可以提升源文本的翻译结果的翻译质量,此外,在人工修正的提示下进行自动修正,可以有效提升修正效率。
-
公开(公告)号:CN109584886B
公开(公告)日:2023-01-17
申请号:CN201811475745.8
申请日:2018-12-04
Applicant: 科大讯飞股份有限公司
Abstract: 本申请提供了一种基于声纹识别的身份认证方法、装置、设备及存储介质,方法包括:获取目标标识的关联标识信息,目标标识的关联标识信息至少包括:在预设时间段内,与目标标识直接或间接产生联系的标识组成的目标标识集合;基于目标标识的关联标识信息,确定目标标识对应的标识度量矢量;基于目标标识对应的声纹矢量和标识度量矢量,确定目标标识对应的用户身份信息。本申请在基于目标标识对应的声纹矢量确定目标标识对应的用户身份信息时,用能够表征目标标识的关联标识信息的标识度量矢量进行辅助,能够较准确确定出目标标识对应的用户身份信息,用户体验较好。
-
公开(公告)号:CN115376214A
公开(公告)日:2022-11-22
申请号:CN202210813381.X
申请日:2022-07-11
Applicant: 科大讯飞股份有限公司
IPC: G06V40/70 , G06V10/40 , G06V10/74 , G06V10/774
Abstract: 本发明提供一种情绪识别方法、装置、电子设备和存储介质,其中方法包括:确定至少两个模态的待识别数据;基于各个模态的情绪识别模型,确定各个模态的待识别数据的情绪概率分布;基于各个模态的情绪概率分布,确定情绪识别结果;情绪识别模型用于对对应模态的待识别数据进行特征提取,并基于特征提取所得的数据特征进行情绪识别;各个模态的情绪识别模型是基于各个模态的样本数据的样本数据特征在同一空间内的特征相似度,和/或,各个模态的样本数据的预测概率分布之间的分布相似度,联合训练得到,利用不同模态的样本数据所表征的情绪信息的一致性,和相同情绪在不同模态间的互补关系训练模型,能够提升模型的泛化能力和情绪识别过程的精准度。
-
公开(公告)号:CN113724713A
公开(公告)日:2021-11-30
申请号:CN202111042821.8
申请日:2021-09-07
Applicant: 科大讯飞股份有限公司
Abstract: 本申请提供了一种语音识别方法、装置、设备及存储介质,其中,方法包括:获取目标混合语音的语音特征以及指定说话人的说话人特征;以趋于目标语音特征为提取方向,根据目标混合语音的语音特征以及目标说话人的说话人特征,从目标混合语音的语音特征中提取目标说话人的语音特征,以得到目标说话人的提取语音特征,其中,目标语音特征为用于获得与目标说话人的真实语音内容一致的语音识别结果的语音特征;根据指定说话人的提取语音特征,获取指定说话人的语音识别结果。经由本申请提供的语音识别方法可从包含指定说话人语音的混合语音中较为准确的识别出指定说话人的语音内容,用户体验较好。
-
-
-
-
-
-
-
-
-