-
公开(公告)号:CN107977364A
公开(公告)日:2018-05-01
申请号:CN201711489210.1
申请日:2017-12-30
Applicant: 科大讯飞股份有限公司
IPC: G06F17/27
Abstract: 本发明实施例提供一种维语子词切分方法及装置,属于机器翻译技术领域。该方法包括:根据目标维语词语的词向量及目标维语词语中每一字母的字母向量,确定目标维语词语中每一字母对应的标签;根据目标维语词语中每一字母对应的标签,分别确定目标维语词语中词干的边界字母与词缀的边界字母;根据目标维语词语中词干的边界字母确定目标维语词语中的词干,根据目标维语词语中词缀的边界字母确定目标维语词语中的词缀。由于不需要预先进行大量人工标注及归纳工作,从而切分更为便捷且效率更高。另外,由于不需要依赖词干、词缀列表及切分规则,只需基于目标维语词语的词向量及目标维语词语中每一字母的字母向量,即可进行切分,从而适用范围更广。
-
公开(公告)号:CN107910004A
公开(公告)日:2018-04-13
申请号:CN201711107221.9
申请日:2017-11-10
Applicant: 科大讯飞股份有限公司
CPC classification number: G10L15/26 , G06F17/289 , G10L13/04 , G10L15/22
Abstract: 本发明实施例提供一种语音翻译处理方法及装置,属于语言处理技术领域。该方法包括:在对第一合成语音信号进行播报的过程中,若接收到包含有部分第一合成语音信号的混合语音信号,则停止播报第一合成语音信号。从混合语音信号过滤掉部分第一合成语音信号,得到当前轮次待翻译的语音信号,并作为目标语音信号。基于目标语音信号,获取第二合成语音信号,并播报第二合成语音信号。本发明实施例在接收到包含有部分第一合成语音信号的混合语音信号时,停止播报第一合成语音信号,并播报第二合成语音信号。由于沟通过程中的任意一方,均可按照全双工模式随时打断播报过程,而不用每次都等到一轮播报过程结束,从而可提高沟通效率。
-
公开(公告)号:CN119741943A
公开(公告)日:2025-04-01
申请号:CN202411542063.X
申请日:2024-10-31
Applicant: 科大讯飞股份有限公司
Abstract: 本申请公开了一种鱼群状态监测方法及相关装置,涉及人工智能技术领域,包括:预先利用鱼群声音信号样本以及鱼群声音信号样本对应的鱼群状态标签训练得到鱼群状态监测模型,在获取待监测的鱼群声音信号之后,将待监测的鱼群声音信号输入鱼群状态监测模型,即可得到鱼群状态监测模型对待监测的鱼群声音信号进行处理后输出的鱼群状态监测结果,由于鱼群声音信号在深远海中能在水下远距离传播,且设备要求较低,因此能够适用于深远海养殖环境的鱼群状态的有效监测。
-
公开(公告)号:CN119323970A
公开(公告)日:2025-01-17
申请号:CN202411236647.4
申请日:2024-09-04
Applicant: 南方海洋科学与工程广东省实验室(湛江) , 科大讯飞股份有限公司
Abstract: 本申请公开了一种摄食强度检测方法及相关装置、设备和存储介质,其中,摄食强度检测方法包括:基于摄食检测模型对目标水域中目标水产物的摄食音频进行检测,得到第一摄食强度;其中,摄食检测模型基于样本音频集训练得到;获取第一摄食强度经校核之后的第二摄食强度;基于标注有第二摄食强度并作为样本音频的摄食音频,更新样本音频集,基于摄食强度的校核统计结果,得到表征目标水产物的当前生长阶段是否适配于摄食检测模型的模型分析结果;基于模型分析结果,确定是否基于样本音频集对摄食检测模型进行优化训练。上述方案,能够提升检测摄食强度的准确性和稳定性,特别是在深远海养殖场景中。
-
公开(公告)号:CN113113024B
公开(公告)日:2024-08-23
申请号:CN202110474762.5
申请日:2021-04-29
Applicant: 中国科学技术大学 , 科大讯飞股份有限公司
Abstract: 本发明提供一种语音识别方法、装置、电子设备和存储介质,其中方法包括:确定用户的待识别语音;基于预设状态转移路径,对所述待识别语音进行语音识别解码,得到语音识别结果;所述预设状态转移路径是基于所述用户的地域信息和/或历史输入信息扩充得到的。本发明提供的语音识别方法、装置、电子设备和存储介质,基于当前用户的地域信息和/或历史输入信息动态扩充解码网络中的预设状态转移路径,从而基于扩充后的预设状态转移路径对该用户的待识别语音进行语音识别解码,利用该用户的个性化信息,提升了个性化语音识别的准确性,且动态扩充预设状态转移路径的方式,增强了实用性。
-
公开(公告)号:CN112686060B
公开(公告)日:2024-04-30
申请号:CN202011593186.8
申请日:2020-12-29
Applicant: 中国科学技术大学 , 科大讯飞股份有限公司
Abstract: 本发明提供一种文本翻译方法、装置、电子设备和存储介质,其中方法包括:确定源语言文本及其所属领域;将源语言文本输入至所属领域对应的领域机器翻译模型中,得到领域机器翻译模型输出的目标语言文本;领域机器翻译模型是基于对应领域下的样本源语言文本及其样本目标语言文本训练得到的;领域机器翻译模型用于基于源语言文本在所属领域和通用场景下的文本特征,进行文本翻译。本发明提供的方法、装置、电子设备和存储介质,结合特定领域和通用场景下的文本特征进行机器翻译,在提升特定领域文本的翻译效果的同时,保障通用场景文本的翻译效果不下降,从而避免由于领域分类错误导致的文本翻译效果大幅下降的问题。
-
公开(公告)号:CN112668346B
公开(公告)日:2024-04-30
申请号:CN202011554126.5
申请日:2020-12-24
Applicant: 中国科学技术大学 , 科大讯飞股份有限公司
IPC: G06F40/58 , G06N3/0464 , G06N3/0442 , G06N3/0455
Abstract: 本申请公开了一种翻译方法、装置、设备及存储介质,本申请同时获取源语言文本、源语言文本的语音信息及源语言文本中每一文本子单元的结构信息,分别对源语言文本、语音信息及结构信息进行特征提取,得到源语言文本对应的文本特征、语音信息对应的语音特征以及源语言文本对应的结构特征,进而基于三种特征进行翻译,得到翻译后的目标语言文本。由此可见,本申请在翻译过程中,将文本、发音及结构作为同一源语言文本的不同认知层面来综合考虑,基于三种特征进行翻译,实现了资源信息的充分利用,同时,由于翻译时所参考的信息更加丰富,既能够提高翻译过程的鲁棒性,又可以提高翻译结果的质量。
-
公开(公告)号:CN112735417B
公开(公告)日:2024-04-26
申请号:CN202011591155.9
申请日:2020-12-29
Applicant: 中国科学技术大学 , 科大讯飞股份有限公司
Abstract: 本发明提供一种语音翻译方法、电子设备、存储介质。其中,语音翻译方法,包括:在获取待翻译语音数据的过程中对待翻译语音数据进行流式语音识别;对当前流式语音识别进行即时判定,以判定识别的当前识别结果是否触发翻译操作,若是,对当前识别结果进行翻译。其能够降低翻译等待时间,提高翻译效率。
-
公开(公告)号:CN113707131B
公开(公告)日:2024-04-16
申请号:CN202111002039.3
申请日:2021-08-30
Applicant: 中国科学技术大学 , 科大讯飞股份有限公司
IPC: G10L15/02 , G10L15/06 , G10L15/183 , G10L15/26
Abstract: 本申请公开了一种语音识别方法、装置、设备及存储介质,本申请对待识别语音数据进行语音识别所使用的语音识别模型包含有语言模型,语言模型是基于第一子词发音词典及第一分词结果所训练得到,该第一分词结果包括了利用包含初始语言模型的语音识别模型,对包含稀疏词的语音进行识别,并对识别错误的稀疏词进行重新分词所得的分词结果,该第一子词发音词典包括识别错误的稀疏词重新分词后的分词结果与对应的音素序列。本申请基于第一子词发音词典及第一分词结果所训练的语言模型相比于初始语言模型能够对稀疏词进行正确分词及发音预测,利用包含该语言模型的语音识别模型,能够对待识别语音数据进行正确的语音识别,提升稀疏词的语音识别准确率。
-
公开(公告)号:CN112347789B
公开(公告)日:2024-04-12
申请号:CN202011230897.9
申请日:2020-11-06
Applicant: 科大讯飞股份有限公司
IPC: G06F40/30 , G06F40/289
Abstract: 本申请提供了一种标点预测方法、装置、设备及存储介质,其中,方法包括:获取待预测文本,其中,待预测文本为当前语音片段的当前识别结果;以待预测文本是否为当前语音片段的首个中间识别结果为依据,获取历史预测信息,其中,历史预测信息为,在对历史识别结果进行标点预测的过程中所产生的、用于确定标点预测结果的中间信息;根据历史预测信息和待预测文本预测待预测文本中词的标点信息。本申请提供的标点预测方法具有较高的预测准确度和预测效率,该优势使得本申请提供的标点预测方法能够适用于机器同声传译场景。
-
-
-
-
-
-
-
-
-