一种说话人分离方法及其相关设备

    公开(公告)号:CN113362831A

    公开(公告)日:2021-09-07

    申请号:CN202110785541.X

    申请日:2021-07-12

    Abstract: 本申请公开了一种说话人分离方法及其相关设备,该方法包括:在获取到包括至少一个说话人的语音信息的待分离语音数据之后,可以先将该待分离语音数据输入预先构建的语音分离模型,得到该语音分离模型输出的至少一个语音分离数据,以使各个语音分离数据所携带语音信息的说话人不同(也就是,不同语音分离数据用于记录不同说话人的语音信息);再根据该至少一个语音分离数据,确定该待分离语音数据的说话人分离结果,以使该说话人分离结果能够准确地表示出该待分离语音数据中每一个说话人对应的语音片段,如此能够有效地避免因无法准确地识别出重叠音频数据对应的多个说话人而导致的不良影响,从而能够有效地提高说话人分离准确性。

    一种语音翻译模型的训练方法及装置

    公开(公告)号:CN109785824B

    公开(公告)日:2021-04-06

    申请号:CN201910198404.9

    申请日:2019-03-15

    Abstract: 本申请公开了一种语音翻译模型的训练方法及装置,该方法包括:首先获取包括各个样本语音的模型训练数据,然后,利用当前的语音翻译模型对获取到的样本语音进行直接翻译,得到预测翻译文本,同时,利用当前的语音识别模型对获取到的样本语音进行识别,得到预测识别文本,接着,根据得到的预测翻译文本与预测识别文本,更新语音翻译模型和语音识别模型的参数。由于语音翻译模型与语音识别模型共享部分模型参数,所以,当更新语音识别模型的参数时,同样会对语音翻译模型中共享部分的模型参数进行更新,从而使得语音翻译模型的这部分模型参数更加准确,进而在利用该语音翻译模型进行语音翻译时,能够提升语音翻译模型的翻译性能。

    一种领域数据获取方法、机器翻译方法及相关设备

    公开(公告)号:CN112417896A

    公开(公告)日:2021-02-26

    申请号:CN202011210710.9

    申请日:2020-11-03

    Abstract: 本申请提供了一种领域数据获取方法、机器翻译方法及相关设备,领域数据获取方法可确定出通用领域的训练语料集中训练语料对应的第一目标值,由于第一目标值能够表征对应的训练语料与指定领域的匹配程度,因此,基于通用领域的训练语料集中训练语料对应的第一目标值,能够从通用领域的训练语料集中筛选出指定领域的训练语料。在此基础上,本申请还提供了一种机器翻译方法,该方法可利用预先建立的领域翻译模型实现指定领域文本的翻译,由于领域翻译模型采用大量指定领域的训练语料对通用翻译模型进行微调得到,因此,其为能够适应于指定领域的翻译模型,利用该翻译模型对指定领域的文本进行翻译,能够获得比较准确的翻译结果。

    语种识别方法、装置、电子设备和存储介质

    公开(公告)号:CN111445898A

    公开(公告)日:2020-07-24

    申请号:CN202010187616.X

    申请日:2020-03-17

    Inventor: 方昕 李晋 刘俊华

    Abstract: 本发明实施例提供一种语种识别方法、装置、电子设备和存储介质,其中方法包括:确定待识别语音数据;将待识别语音数据输入至语种识别模型中,得到语种识别模型输出的语种识别结果;语种识别模型是基于样本语音数据、样本语音数据的语种,以及多个语种的描述文本训练得到的;多个语种包括集内语种和集外语种,集内语种为样本语音数据的语种。本发明实施例提供的语种识别方法、装置、电子设备和存储介质,语种识别模型基于集内语种和集外语种的描述文本,对待识别语音数据进行语种识别,实现了包含集外语种在内的准确的语种识别。

    一种翻译模型训练方法、文本翻译方法及相关装置

    公开(公告)号:CN110298046A

    公开(公告)日:2019-10-01

    申请号:CN201910595220.6

    申请日:2019-07-03

    Abstract: 本申请公开了一种翻译模型训练方法、文本翻译方法及相关装置,在该方法中,将至少一个样本文本中输入双向翻译模型,以便根据双向翻译模型的输出结果对双向翻译模型进行参数更新,其中,双向翻译模型的输出结果包括每一样本文本的预测翻译文本以及每一样本文本对应的预测词袋,且该预测词袋是朝着对应样本文本的实际词袋的方向预测得到的,该实际词袋包括对应样本文本的实际翻译文本中的各个不同词,因此,在对模型进行参数更新时,需要基于每一样本文本的预测词袋与其实际词袋之间的差异进行参数更新,使得该实际词袋可以用于指导翻译方向,故而,训练完成的双向翻译模型能够朝着输入样本文本的实际词袋的方向进行准确翻译。

    一种语音翻译方法及装置
    107.
    发明公开

    公开(公告)号:CN109979461A

    公开(公告)日:2019-07-05

    申请号:CN201910199082.X

    申请日:2019-03-15

    Abstract: 本申请公开了一种语音翻译方法及装置,该方法包括:在获取到待翻译的目标语音后,将目标语音的识别文本和目标语音本身这二者共同作为翻译对象进行翻译,以得到目标语音的最终翻译文本,相比于现有技术中先对目标语音进行识别,得到识别文本,再将该识别文本作为翻译对象进行翻译的方式,本申请中的翻译对象更为丰富,即包括识别文本和目标语音两个翻译对象,故而,通过对这两个翻译对象进行翻译的方式,可以确定出更准确的目标语音的翻译文本。

    一种翻译质量的确定方法及装置

    公开(公告)号:CN109858042A

    公开(公告)日:2019-06-07

    申请号:CN201811384436.X

    申请日:2018-11-20

    Abstract: 本申请公开了一种翻译质量的确定方法及装置,该方法包括:获取目标文本,该目标文本是对源文本进行翻译后的文本,然后,生成各个文本特征,每一文本特征是根据源文本和/或目标文本生成的与翻译质量相关的特征,最后根据生成的各个文本特征,确定目标文本的翻译质量。可见,本申请根据目标文本对应的各个文本特征来评价其翻译质量,可以保证评价结果的准确性,此外,与现有技术中利用参考译文进行自动评价或直接进行人工评价的方式,节省了大量人力。

    一种语音翻译方法及装置
    109.
    发明公开

    公开(公告)号:CN108710616A

    公开(公告)日:2018-10-26

    申请号:CN201810503163.X

    申请日:2018-05-23

    Inventor: 占萌萌 刘俊华

    CPC classification number: G06F17/2809 G10L15/005 G10L15/265

    Abstract: 本申请公开了一种语音翻译方法及装置,所述方法包括:对用户的源语音数据进行翻译,得到第一翻译文本,该第一翻译文本的语种与源语音数据的语种不同,然后,通过与用户进行交互,判断第一翻译文本作为源语音数据的翻译结果是否正确。可见,本申请通过对第一翻译文本作为源语音数据的翻译结果是否正确进行判断,可以基于判断结果对第一翻译文本进行处理,从而可以提高翻译结果的准确性。

    文本翻译处理方法及装置
    110.
    发明公开

    公开(公告)号:CN108228574A

    公开(公告)日:2018-06-29

    申请号:CN201711288979.7

    申请日:2017-12-07

    Abstract: 本发明实施例提供一种文本翻译处理方法及装置,属于语言处理技术领域。该方法包括:若第一识别文本的识别置信度大于第一预设阈值且第一目标语言文本的翻译置信度不大于第二预设阈值,则对第一目标语言文本进行翻译,得到第二识别文本;若第一识别文本与第二识别文本之间语义不等价,获取关键名词及关键名词的类型;基于关键名词的类型对关键名词进行翻译,得到第一翻译结果,对第一识别文本中除关键名词之外的其它内容进行翻译,得到第二翻译结果,将第一翻译结果与第二翻译结果进行合并得到第二目标语言文本。由于可将第一识别文本中的关键名词作为一个整体分词,按照关键名词类型对关键名词进行翻译,从而可使得翻译结果更加准确。

Patent Agency Ranking