-
公开(公告)号:CN106294311B
公开(公告)日:2019-03-19
申请号:CN201510332794.6
申请日:2015-06-12
Applicant: 科大讯飞股份有限公司
IPC: G06F17/27
Abstract: 本发明公开了一种藏语声调预测方法及系统,包括接收待处理藏语文本;对待处理藏语文本进行分词处理,得到各词单元及各词单元的侯选词性;确定各词单元的类型;根据所述词单元在所述待处理藏语文本中的上下文环境信息及所述词单元的类型,确定所述词单元的词性;根据所述词单元的上下文环境信息及词单元的词性,确定所述词单元的声调信息;根据各词单元的声调信息获得所述待处理藏语文本的声调信息。本发明在预测词单元声调过程中,不仅考虑了词单元的上下文环境信息,还考虑了词单元的词性对声调的影响,从而使藏语连续语流中的连读变调更加自然。
-
公开(公告)号:CN119339704A
公开(公告)日:2025-01-21
申请号:CN202411531365.7
申请日:2024-10-30
Applicant: 科大讯飞股份有限公司
IPC: G10L13/02 , G10L13/047
Abstract: 本申请公开了一种韩语文本发音预测方法、语音合成方法、装置、相关设备及计算机程序产品,对于目标韩语文本中每一单词,将其和发音词典进行匹配,如果词面和发音规则均匹配成功,则使用匹配成功的词典发音作为当前单词的发音。如果词面匹配成功但发音规则匹配失败,则获取发音词典中匹配成功的词面下的目标发音信息。调用发音预测模型预测当前单词的候选发音信息,利用候选发音信息中首音素和/或尾音素,替换目标发音信息中的首音素和/或尾音素,得到当前单词的发音。通过融合不同的发音预测方式,提高韩语单词的发音预测准确性,尤其是提高了韩语针对音变部分的预测准确度,提升了语音合成效果,降低发音词典构建的难度。
-
公开(公告)号:CN114548049B
公开(公告)日:2025-01-07
申请号:CN202210202517.3
申请日:2022-03-02
Applicant: 科大讯飞股份有限公司
Abstract: 本申请公开了一种数字正则化方法、装置、设备及存储介质,本申请对于包含待正则化处理的数字的原始文本,确定其中数字的属性标签,数字的属性可以是影响数字正则化结果的相关属性,在此基础上,基于数字的属性标签及数字在原始文本中的上下文信息,将数字正则化为与原始文本同语种的单词表示,得到数字的正则化结果。本申请方案不需要针对不同语种总结数字正则化规则,流程更加简洁,并且在数字正则化时可以充分利用原始文本中数字的上下文信息,能够消除一些正则化结果上的歧义问题,提升正则化结果的准确度,进一步,数字正则化过程还参考数字的属性标签,也即考虑了数字的不同属性对正则化的影响,有助于进一步提升正则化结果的准确度。
-
公开(公告)号:CN114548049A
公开(公告)日:2022-05-27
申请号:CN202210202517.3
申请日:2022-03-02
Applicant: 科大讯飞股份有限公司
Abstract: 本申请公开了一种数字正则化方法、装置、设备及存储介质,本申请对于包含待正则化处理的数字的原始文本,确定其中数字的属性标签,数字的属性可以是影响数字正则化结果的相关属性,在此基础上,基于数字的属性标签及数字在原始文本中的上下文信息,将数字正则化为与原始文本同语种的单词表示,得到数字的正则化结果。本申请方案不需要针对不同语种总结数字正则化规则,流程更加简洁,并且在数字正则化时可以充分利用原始文本中数字的上下文信息,能够消除一些正则化结果上的歧义问题,提升正则化结果的准确度,进一步,数字正则化过程还参考数字的属性标签,也即考虑了数字的不同属性对正则化的影响,有助于进一步提升正则化结果的准确度。
-
公开(公告)号:CN114170998A
公开(公告)日:2022-03-11
申请号:CN202111339548.5
申请日:2021-11-12
Applicant: 科大讯飞股份有限公司
IPC: G10L13/06 , G10L13/07 , G10L13/08 , G06F40/242 , G06F40/289
Abstract: 本申请提供了一种停顿位置预测方法、语音合成方法及相关设备,其中,停顿位置预测方法包括:获取目标文本;基于预先建立的第一词典,对目标文本进行分词,获得目标文本的分词结果,其中,第一词典中包括若干第一基本语言单元和若干第二基本语言单元,第一基本语言单元为发生连读的多个文法词组成的文法词串,第二基本语言单元为不与其他文法词发生连读的单个文法词;根据目标文本的分词结果,预测目标文本的停顿位置。经由本申请提供的停顿位置预测方法可预测出较为合理的停顿位置,根据采用本申请提供的停顿位置预测方法针对目标文本预测的停顿位置进行语音合成,能够获得效果较好的合成语音。
-
公开(公告)号:CN106294311A
公开(公告)日:2017-01-04
申请号:CN201510332794.6
申请日:2015-06-12
Applicant: 科大讯飞股份有限公司
IPC: G06F17/27
Abstract: 本发明公开了一种藏语声调预测方法及系统,包括接收待处理藏语文本;对待处理藏语文本进行分词处理,得到各词单元及各词单元的侯选词性;确定各词单元的类型;根据所述词单元在所述待处理藏语文本中的上下文环境信息及所述词单元的类型,确定所述词单元的词性;根据所述词单元的上下文环境信息及词单元的词性,确定所述词单元的声调信息;根据各词单元的声调信息获得所述待处理藏语文本的声调信息。本发明在预测词单元声调过程中,不仅考虑了词单元的上下文环境信息,还考虑了词单元的词性对声调的影响,从而使藏语连续语流中的连读变调更加自然。
-
公开(公告)号:CN114170998B
公开(公告)日:2025-01-28
申请号:CN202111339548.5
申请日:2021-11-12
Applicant: 科大讯飞股份有限公司
IPC: G10L13/06 , G10L13/07 , G10L13/08 , G06F40/242 , G06F40/289
Abstract: 本申请提供了一种停顿位置预测方法、语音合成方法及相关设备,其中,停顿位置预测方法包括:获取目标文本;基于预先建立的第一词典,对目标文本进行分词,获得目标文本的分词结果,其中,第一词典中包括若干第一基本语言单元和若干第二基本语言单元,第一基本语言单元为发生连读的多个文法词组成的文法词串,第二基本语言单元为不与其他文法词发生连读的单个文法词;根据目标文本的分词结果,预测目标文本的停顿位置。经由本申请提供的停顿位置预测方法可预测出较为合理的停顿位置,根据采用本申请提供的停顿位置预测方法针对目标文本预测的停顿位置进行语音合成,能够获得效果较好的合成语音。
-
-
-
-
-
-