-
公开(公告)号:CN107886940A
公开(公告)日:2018-04-06
申请号:CN201711107222.3
申请日:2017-11-10
Applicant: 科大讯飞股份有限公司
CPC classification number: G10L15/005 , G06F17/2827 , G06F17/289 , G10L15/02 , G10L15/26
Abstract: 本发明实施例提供一种语音翻译处理方法及装置,属于语言处理技术领域。该方法包括:若判断获知上一轮次的第一语音信号与当前轮次待翻译的第二语音信号均对应相同的语种类型,则基于第一语音信号对应的文本数据对第二语音信号对应的文本数据进行调整,得到第二语音信号对应调整后的文本数据;获取调整后的文本数据对应的合成语音信号,并播报合成语音信号。由于上一轮次的第一语音信号与当前轮次待翻译的第二语音信号在内容上可能是有关联的,从而基于第一语音信号对应的文本数据对第二语音信号对应的文本数据进行调整,可使得翻译结果会更加切合场景且更加精准。
-
公开(公告)号:CN107577773A
公开(公告)日:2018-01-12
申请号:CN201710803315.3
申请日:2017-09-08
Applicant: 科大讯飞股份有限公司
Abstract: 本发明公开了一种音频匹配方法及装置、电子设备,所述方法包括如下步骤:步骤一,获取待匹配音频数据;步骤二,对所述待匹配音频数据进行分割,得到多个分割后的待匹配音频片段;步骤三,提取每段待匹配音频片段的音频指纹特征,根据提取的音频指纹特征利用预先构建的音频匹配库对每段待匹配音频片段进行音频匹配,得到每段待匹配音频片段的音频匹配结果;步骤四,对各待匹配音频片段的匹配结果进行合并,得到所述待匹配音频数据的匹配结果,通过本发明可提高音频检索的效率。
-
公开(公告)号:CN107506345A
公开(公告)日:2017-12-22
申请号:CN201610423002.0
申请日:2016-06-14
Applicant: 科大讯飞股份有限公司
IPC: G06F17/27
CPC classification number: G06F17/277 , G06F17/2785
Abstract: 本发明提出一种语言模型的构建方法和装置,该方法包括:确定建模单元;获取所述建模单元的词向量,以及除所述词向量之外的其他特征向量;根据所述词向量和所述其他特征向量,生成所述建模单元对应的语言模型。该方法能够提高构建的语言模型的效果。
-
公开(公告)号:CN105991290A
公开(公告)日:2016-10-05
申请号:CN201510100856.0
申请日:2015-03-06
Applicant: 科大讯飞股份有限公司
Abstract: 本发明公开了一种伪随机声纹密码文本生成方法及系统,该方法包括:在用户注册阶段生成一个或多个注册声纹密码文本;将所述多个注册声纹密码文本进行拆分,并将拆分后得到的所有声纹密码子文本作为注册声纹密码子文本集合;从所述注册声纹密码子文本集合中选择声纹密码子文本;将选择的声纹密码子文本组合后作为所述用户认证时的声纹密码文本。利用本发明,可以提升声纹认证的准确度。
-
公开(公告)号:CN105991288A
公开(公告)日:2016-10-05
申请号:CN201510100196.6
申请日:2015-03-06
Applicant: 科大讯飞股份有限公司
Abstract: 本发明公开了一种声纹密码文本生成方法及系统,该方法包括:确定各声纹密码文本字符的说话人区分性能;选择说话人区分性能满足要求的字符构建声纹密码文本候选字符集;从所述声纹密码文本候选字符集挑选字符生成声纹密码文本。利用本发明,可以提高声纹认证的准确性。
-
公开(公告)号:CN114492469B
公开(公告)日:2024-11-08
申请号:CN202111630203.5
申请日:2021-12-28
Applicant: 科大讯飞股份有限公司
IPC: G06F40/58 , G06F40/30 , G06F40/289 , G06F18/214
Abstract: 本申请公开了一种翻译方法、翻译装置和计算机可读存储介质,该翻译方法包括:获取待处理数据,将待处理数据输入第一翻译模型,得到翻译数据;其中,第一翻译模型的训练方法包括:获取训练完的第二翻译模型、原始平行语料以及多个新词集,新词集包括第一新词以及至少一个第二新词,第二新词为第一新词的译文;对新词集进行处理,得到包含新词集的第一训练平行语料;对第一训练平行语料进行清洗处理,得到第二训练平行语料;采用原始平行语料与第二训练平行语料,对第二翻译模型进行更新训练,得到第一翻译模型。通过上述方式,本申请能够提升新词的翻译效果。
-
公开(公告)号:CN113724689B
公开(公告)日:2024-04-30
申请号:CN202110910287.1
申请日:2021-08-09
Applicant: 中国科学技术大学 , 科大讯飞股份有限公司
Abstract: 本申请公开了一种语音识别方法及相关装置、电子设备、存储介质,其中,语音识别方法包括:获取若干音频帧的语义特征表示;利用语音识别模型对若干音频帧的语义特征表示进行识别,得到若干音频帧对应的识别文本;其中,语音识别模型采用注意力机制,且注意力机制的掩膜是基于语音识别要求的时延而生成的。上述方案,能够降低不同时延要求下语音识别的复杂度和成本。
-
公开(公告)号:CN113409792B
公开(公告)日:2024-02-13
申请号:CN202110694320.1
申请日:2021-06-22
Applicant: 中国科学技术大学 , 科大讯飞股份有限公司
Abstract: 本申请公开了一种语音识别方法及其相关设备,该方法包括:在获取到当前语音段和该当前语音段对应的参考语音后,先依据待使用状态数据和该当前语音段对应的参考语音,对该当前语音段进行编码处理,得到该当前语音段的语音编码和该当前语音段的编码状态数据;再对该当前语音段的语音编码进行解码处理,得到该当前语音段对应的语音文本,并利用该当前语音段的编码状态数据,更新该待使用状态数据。如此能够实现边采集用户语音边进行语音识别的目的,可以提高语音识别的实时性。又因当前语音段的历史语音信息(也就是,待使用状态数据)在历史语音识别过程中已计算过,使得在当前轮语音识别过程中直接使用即可,如此有利于提高语音识别的实时性。
-
公开(公告)号:CN112417896B
公开(公告)日:2024-02-02
申请号:CN202011210710.9
申请日:2020-11-03
Applicant: 中国科学技术大学 , 科大讯飞股份有限公司
Abstract: 本申请提供了一种领域数据获取方法、机器翻译方法及相关设备,领域数据获取方法可确定出通用领域的训练语料集中训练语料对应的第一目标值,由于第一目标值能够表征对应的训练语料与指定领域的匹配程度,因此,基于通用领域的训练语料集中训练语料对应的第一目标值,能够从通用领域的训练语料集中筛选出指定领域的训练语料。在此基础上,本申请还提供了一种机器翻译方法,该方法可利用预先建立的领域翻译模型实现指定领域文本的翻译,由于领域翻译模型采用大量指定领域的训练语料对通用翻译模型进行微调得到,因此,其为能够适应于指定领域的翻译模型,利用该翻译模型对指定领域的文本进行翻译,能够获得比较准确的翻译结果。
-
公开(公告)号:CN110210043B
公开(公告)日:2024-01-26
申请号:CN201910514220.9
申请日:2019-06-14
Applicant: 科大讯飞股份有限公司
IPC: G06F40/58 , G06F40/289
Abstract: 本申请提供一种文本翻译方法、装置、电子设备及可读存储介质,方法包括:接收待翻译的源语言文本;将所述源语言文本输入到翻译模型中,由所述翻译模型根据多个双语短语对的信息,对所述源语言文本进行编码和解码,得到所述源语言文本对应的目标语言文本。该方法使得在翻译过程中源语言文本的语义信息得以保留,从而极大提升翻译效果。
-
-
-
-
-
-
-
-
-