一种音频特征提取方法与装置、电子设备

    公开(公告)号:CN107622773B

    公开(公告)日:2021-04-06

    申请号:CN201710803397.1

    申请日:2017-09-08

    Abstract: 本发明公开了一种音频特征提取方法及装置、电子设备,所述方法包括如下步骤:步骤一,获取待处理音频数据;步骤二,根据所述待处理音频数据的频谱能量幅度,确定待处理音频数据的原始候选极值点;步骤三,基于候选极值点之间的影响系数和/或基于候选极值点的密度和/或基于候选极值点之间的差分计算结果对每帧音频数据的原始候选极值点进行筛选,得到所述待处理音频数据的极值点列表;步骤四,根据所述待处理音频数据的极值点列表提取音频数据的指纹特征,通过本发明可提高提取的音频特征的抗噪性,使提取的音频特征能更准确的描述音频数据。

    文本处理方法、装置、设备及可读存储介质

    公开(公告)号:CN110162801A

    公开(公告)日:2019-08-23

    申请号:CN201910456776.7

    申请日:2019-05-29

    Abstract: 本申请实施例公开了一种文本处理方法、装置、设备及可读存储介质,获得源语言文本和目标语言内容片段后,根据目标语言内容片段与源语言文本的内容相关的特征信息,在源语言文本中确定与目标语言内容片段对应的源语言文本片段。基于目标语言内容片段与源语言文本片段的对应关系,可以为用户提供优化服务,如在翻译场景下,机器对发言人的语音进行识别得到源语言文本,翻译人员对发言人的语音进行翻译,得到目标语言内容片段,通过本案可以在翻译过程实时给出源语言文本中与目标语音内容片段对应的源语言文本片段,基于此可以对翻译人员给出翻译进度提示,避免遗漏的情况,为用户提供更优化服务。

    一种语音翻译模型的训练方法及装置

    公开(公告)号:CN109785824A

    公开(公告)日:2019-05-21

    申请号:CN201910198404.9

    申请日:2019-03-15

    Abstract: 本申请公开了一种语音翻译模型的训练方法及装置,该方法包括:首先获取包括各个样本语音的模型训练数据,然后,利用当前的语音翻译模型对获取到的样本语音进行直接翻译,得到预测翻译文本,同时,利用当前的语音识别模型对获取到的样本语音进行识别,得到预测识别文本,接着,根据得到的预测翻译文本与预测识别文本,更新语音翻译模型和语音识别模型的参数。由于语音翻译模型与语音识别模型共享部分模型参数,所以,当更新语音识别模型的参数时,同样会对语音翻译模型中共享部分的模型参数进行更新,从而使得语音翻译模型的这部分模型参数更加准确,进而在利用该语音翻译模型进行语音翻译时,能够提升语音翻译模型的翻译性能。

    一种分类模型的生成方法及装置

    公开(公告)号:CN108304890A

    公开(公告)日:2018-07-20

    申请号:CN201810218705.9

    申请日:2018-03-16

    Abstract: 本申请公开了一种分类模型的生成方法及装置,该方法包括:获取目标训练数据,该目标训练数据包括同一数据类型下划分的不同领域数据,利用该目标训练数据训练特征生成器、主分类器以及辅助分类器,其中,特征生成器用于将目标训练数据的原始特征数据变换到同一特征空间中以得到变换后特征数据,主分类器用于根据变换后特征数据将目标训练数据进行分类预测,辅助分类器用于根据变换后特征数据将目标训练数据所属的划分领域进行区分。由于特征生成器的构建目的是为了降低辅助分类器的领域区分能力,当辅助分类器无法进行领域区分时便可以结束训练,因为此时的主分类器将不受划分领域的限制,这使得主分类器的分类结果更加准确。

    平行句对构建方法、装置、电子设备和存储介质

    公开(公告)号:CN115062633B

    公开(公告)日:2025-05-13

    申请号:CN202210688236.3

    申请日:2022-06-16

    Abstract: 本发明提供一种平行句对构建方法、装置、电子设备和存储介质,其中方法包括:获取第一语句和第二语句,第一语句和第二语句对应不同语种;基于跨语种语言模型,确定第一语句的第一语义特征和第二语句的第二语义特征,跨语种语言模型是基于第一样本语句中各分词与第二样本语句中各分词之间的词义关系训练得到的,第一样本语句和第二样本语句对应不同语种;基于第一语义特征和第二语义特征之间的相似度,构建平行句对,本发明实施例中,应用不同语种的样本语句各自包含的分词之间的词义关系,进行模型训练,能够使训练所得的模型性能更优,在面向稀缺资源语言时,提升了句子嵌入的准确度,精进了平行句对的构建过程,实现了平行句对构建质量的提升。

    一种文本审核方法及相关装置
    27.
    发明公开

    公开(公告)号:CN119336913A

    公开(公告)日:2025-01-21

    申请号:CN202411543319.9

    申请日:2024-10-31

    Abstract: 本申请公开了一种文本审核方法及相关装置,涉及自然语言处理技术领域,文本审核方法包括:获取第一目标文本,第一目标文本为大模型的输入文本;确定第一目标文本的风险类别;若第一目标文本的风险类别为有害,输出预设的兜底回复;若第一目标文本的风险类别为无害,将第一目标文本输入大模型;在第一目标文本的风险类别为无害的情况下,还可获取大模型针对第一目标文本回复的文本,作为第二目标文本;确定第二目标文本的风险类别;若第二目标文本的风险类别为有害,则输出预设的兜底回复;若第二目标文本的风险类别为无害,则输出第二目标文本。本申请公开的文本审核方法能够确保大模型输出无害的文本。

    模型训练方法、说话人识别方法、装置、设备、介质及产品

    公开(公告)号:CN118197321A

    公开(公告)日:2024-06-14

    申请号:CN202410189599.1

    申请日:2024-02-20

    Abstract: 本申请提出一种模型训练方法、说话人识别方法、装置、设备、介质及产品,该模型训练方法包括:在对声纹提取模型进行声纹身份预测训练的过程中,基于所述声纹提取模型的隐层声学特征,执行声学特征预测任务,得到声学特征预测结果;所述声学特征预测任务包括根据所述语音数据的第一语音帧的声学特征,预测所述语音数据的第二语音帧的声学特征;基于所述声学特征预测结果以及所述第二语音帧的真实声学特征,确定声学特征预测损失;以降低所述声学特征预测损失和所述声纹提取模型的身份预测训练损失为目标,对所述声纹提取模型进行参数优化。上述方案训练得到的声纹提取模型能够提取高精度的声纹模型,进而可以支持实现更高精度的声纹识别。

    语音翻译方法、装置、设备及存储介质

    公开(公告)号:CN117808016A

    公开(公告)日:2024-04-02

    申请号:CN202311868951.6

    申请日:2023-12-28

    Inventor: 占萌萌 刘俊华

    Abstract: 本申请涉及语言翻译,本申请提供一种语音翻译方法、装置、设备及存储介质,所述方法在一个问询周期内,开始一个对话,通过多个翻译数据库分别对用户的源语音数据进行翻译,得到多个第一翻译文本,基于投票机制,选出待翻译的所述第一翻译文本;通过对应的翻译数据库对所述第一翻译文本进行翻译,得到多个第二翻译文本,基于投票机制,选出翻译结果文本,同时淘汰在翻译所述第一翻译文本、所述第二翻译文本时两者均与其他翻译数据库翻译的结果不同的翻译数据库;开始下一对话,重复投票回合,直至多个翻译数据库输出的翻译结果文本重复率达到预定数,停止投票机制,翻译数据库直接输出翻译结果文本。

    一种翻译质量的确定方法及装置

    公开(公告)号:CN109858042B

    公开(公告)日:2024-02-20

    申请号:CN201811384436.X

    申请日:2018-11-20

    Abstract: 本申请公开了一种翻译质量的确定方法及装置,该方法包括:获取目标文本,该目标文本是对源文本进行翻译后的文本,然后,生成各个文本特征,每一文本特征是根据源文本和/或目标文本生成的与翻译质量相关的特征,最后根据生成的各个文本特征,确定目标文本的翻译质量。可见,本申请根据目标文本对应的各个文本特征来评价其翻译质量,可以保证评价结果的准确性,此外,与现有技术中利用参考译文进行自动评价或直接进行人工评价的方式,节省了大量人力。

Patent Agency Ranking