-
公开(公告)号:CN113936642A
公开(公告)日:2022-01-14
申请号:CN202111222208.4
申请日:2021-10-20
Applicant: 科大讯飞股份有限公司
Abstract: 本申请提出一种发音词典构建方法、语音识别方法及相关装置,该发音词典构建方法,包括:对目标音频数据进行音素提取,得到对应的音素集合;所述目标音频数据为覆盖全部音素的音频数据;根据提取得到的音素集合中的每个音素的识别概率,以及所述目标音频数据对应的音素标签,从所述音素集合中确定出所述音素标签中的音素的相似音素;按照单词与该单词对应的标准发音和相似发音对应存储的规则,构建得到多发音词典;其中,所述标准发音由所述音素标签中的音素构成,所述相似发音由所述音素标签中的音素的相似音素构成。通过上述方案构建的多发音词典,能够提高语音识别的容错性和鲁棒性,进而可以提升语音识别效果。
-
公开(公告)号:CN113707131A
公开(公告)日:2021-11-26
申请号:CN202111002039.3
申请日:2021-08-30
Applicant: 科大讯飞股份有限公司
IPC: G10L15/02 , G10L15/06 , G10L15/183 , G10L15/26
Abstract: 本申请公开了一种语音识别方法、装置、设备及存储介质,本申请对待识别语音数据进行语音识别所使用的语音识别模型包含有语言模型,语言模型是基于第一子词发音词典及第一分词结果所训练得到,该第一分词结果包括了利用包含初始语言模型的语音识别模型,对包含稀疏词的语音进行识别,并对识别错误的稀疏词进行重新分词所得的分词结果,该第一子词发音词典包括识别错误的稀疏词重新分词后的分词结果与对应的音素序列。本申请基于第一子词发音词典及第一分词结果所训练的语言模型相比于初始语言模型能够对稀疏词进行正确分词及发音预测,利用包含该语言模型的语音识别模型,能够对待识别语音数据进行正确的语音识别,提升稀疏词的语音识别准确率。
-
公开(公告)号:CN113609875A
公开(公告)日:2021-11-05
申请号:CN202110901225.4
申请日:2021-08-06
Applicant: 科大讯飞股份有限公司
IPC: G06F40/58 , G06F40/289 , G06F40/30 , G06N3/04 , G06N3/08
Abstract: 本发明提供一种翻译质量评估方法、装置、电子设备和存储介质,其中方法包括:确定原文文本及其对应的待评估译文文本;对所述待评估译文文本进行句级别翻译质量评估,得到句级评估结果;所述句级评估结果包括所述待评估译文文本的语义忠实度和/或语义流利度;对所述待评估译文文本进行词级别翻译质量评估,得到词级评估结果;所述词级评估结果包括所述待评估译文文本中各个分词的翻译准确度和/或对齐匹配度;基于所述句级评估结果和所述词级评估结果,确定所述待评估译文文本的质量评估结果。本发明提高了翻译质量评估的准确性。
-
公开(公告)号:CN113486681A
公开(公告)日:2021-10-08
申请号:CN202110881817.4
申请日:2021-08-02
Applicant: 科大讯飞股份有限公司
IPC: G06F40/58
Abstract: 本申请提供了一种同传翻译方法、装置、设备及存储介质,方法包括:对当前输入数据单元和当前已获得的输出数据单元进行处理,以获得处理结果,根据处理结果预测当前输入数据单元的位置处是否进行数据输出,以及在预测出进行数据输出时,确定输出数据单元并输出;其中,输出位置的预测以及输出位置处输出数据的确定以使翻译质量和翻译延迟共同优化为方向进行。本申请提供的同传翻译方法可实现翻译延迟的动态预测,并且,由于本申请提供的同传翻译方法以使翻译质量和翻译延迟共同优化为方向对数据输出位置和输出数据进行预测,因此,其能够预测出较为合适的翻译延迟以及质量较佳的翻译结果。
-
公开(公告)号:CN107886940B
公开(公告)日:2021-10-08
申请号:CN201711107222.3
申请日:2017-11-10
Applicant: 科大讯飞股份有限公司
Abstract: 本发明实施例提供一种语音翻译处理方法及装置,属于语言处理技术领域。该方法包括:若判断获知上一轮次的第一语音信号与当前轮次待翻译的第二语音信号均对应相同的语种类型,则基于第一语音信号对应的文本数据对第二语音信号对应的文本数据进行调整,得到第二语音信号对应调整后的文本数据;获取调整后的文本数据对应的合成语音信号,并播报合成语音信号。由于上一轮次的第一语音信号与当前轮次待翻译的第二语音信号在内容上可能是有关联的,从而基于第一语音信号对应的文本数据对第二语音信号对应的文本数据进行调整,可使得翻译结果会更加切合场景且更加精准。
-
公开(公告)号:CN113111649A
公开(公告)日:2021-07-13
申请号:CN202110396979.9
申请日:2021-04-13
Applicant: 科大讯飞股份有限公司
IPC: G06F40/284 , G06F40/30 , G06N3/04 , G06N3/08
Abstract: 本发明公开了一种事件抽取方法,包括:依据至少一个预设的参数类型对待抽取文本进行第一参数抽取,获得第一参数信息;若第一参数信息的数量大于两个,则依据所有第一参数信息获得第一抽取结果,并将第一抽取结果作为事件抽取结果,其中,第一抽取结果包括至少一个参数信息组合;本发明还公开了基于上述方法的系统以及设备。本发明通过独立的参数抽取避免了触发词抽取对参数抽取带来的级联误差,提高了事件抽取的准确性和效率。
-
公开(公告)号:CN112767917A
公开(公告)日:2021-05-07
申请号:CN202011641751.3
申请日:2020-12-31
Applicant: 科大讯飞股份有限公司
Abstract: 本申请实施例公开了一种语音识别方法、装置及存储介质,方法包括:对待识别语音数据进行编码,得到第一特征向量序列;对预设热词库中每一热词进行编码,得到第二特征向量序列;对所述预设热词库中每个热词的音频片段进行编码,得到第三特征向量序列;将所述第一特征向量序列和所述第三特征向量序列进行第一注意力操作,得到第四特征向量序列;根据所述第二特征向量序列、所述第三特征向量序列和所述第四特征向量序列进行解码操作,得到识别结果。采用本申请实施例能够提升热词识别精度。
-
公开(公告)号:CN112735417A
公开(公告)日:2021-04-30
申请号:CN202011591155.9
申请日:2020-12-29
Applicant: 科大讯飞股份有限公司
Abstract: 本发明提供一种语音翻译方法、电子设备、存储介质。其中,语音翻译方法,包括:在获取待翻译语音数据的过程中对待翻译语音数据进行流式语音识别;对当前流式语音识别进行即时判定,以判定识别的当前识别结果是否触发翻译操作,若是,对当前识别结果进行翻译。其能够降低翻译等待时间,提高翻译效率。
-
公开(公告)号:CN112699690A
公开(公告)日:2021-04-23
申请号:CN202011591157.8
申请日:2020-12-29
Applicant: 科大讯飞股份有限公司
Abstract: 本发明提供一种语音翻译模型的训练方法、翻译方法、电子设备、存储介质,语音翻译模型包括级联的语音识别模型以及文本翻译模型,训练方法包括:获取到语音样本数据、语音样本数据的语音识别结果以及文本翻译结果;利用语音样本数据、语音识别结果对初始语音识别模型进行训练,以得到语音识别模型;通过语音识别模型对语音样本数据进行语音预测,得到语音样本数据中每个词的识别概率;利用语音样本数据中每个词的识别概率以及文本翻译结果对初始文本翻译模型进行训练,得到文本翻译模型,语音识别模型以及文本翻译模型级联得到语音翻译模型。通过将语音识别模型和文本翻译模型联合训练,解决分阶段进行语音翻译的方法的错误传递问题。
-
公开(公告)号:CN112686059A
公开(公告)日:2021-04-20
申请号:CN202011593142.5
申请日:2020-12-29
Applicant: 科大讯飞股份有限公司
Abstract: 本发明提供一种文本翻译方法、装置、电子设备和存储介质,其中方法包括:确定源语言文本,以及与源语言文本相匹配的翻译文本对;将源语言文本以及翻译文本对输入至机器翻译模型,得到机器翻译模型输出的目标语言文本;机器翻译模型是基于样本源语言文本、与样本源语言文本相匹配的样本翻译文本对,以及样本源语言文本的样本目标语言文本训练得到的。本发明提供的方法、装置、电子设备和存储介质,机器翻译模型能够将翻译文本对的信息作为对源语言文本进行翻译的参考,从而优化翻译效果。且无需重新对机器翻译模型进行迭代优化,且当实际场景发生变化时,仅需累积实际场景变化后的翻译文本对即可保证机器翻译及时满足场景变化需求。
-
-
-
-
-
-
-
-
-