一种文本审核方法及相关装置
    31.
    发明公开

    公开(公告)号:CN119336913A

    公开(公告)日:2025-01-21

    申请号:CN202411543319.9

    申请日:2024-10-31

    Abstract: 本申请公开了一种文本审核方法及相关装置,涉及自然语言处理技术领域,文本审核方法包括:获取第一目标文本,第一目标文本为大模型的输入文本;确定第一目标文本的风险类别;若第一目标文本的风险类别为有害,输出预设的兜底回复;若第一目标文本的风险类别为无害,将第一目标文本输入大模型;在第一目标文本的风险类别为无害的情况下,还可获取大模型针对第一目标文本回复的文本,作为第二目标文本;确定第二目标文本的风险类别;若第二目标文本的风险类别为有害,则输出预设的兜底回复;若第二目标文本的风险类别为无害,则输出第二目标文本。本申请公开的文本审核方法能够确保大模型输出无害的文本。

    模型训练方法、说话人识别方法、装置、设备、介质及产品

    公开(公告)号:CN118197321A

    公开(公告)日:2024-06-14

    申请号:CN202410189599.1

    申请日:2024-02-20

    Abstract: 本申请提出一种模型训练方法、说话人识别方法、装置、设备、介质及产品,该模型训练方法包括:在对声纹提取模型进行声纹身份预测训练的过程中,基于所述声纹提取模型的隐层声学特征,执行声学特征预测任务,得到声学特征预测结果;所述声学特征预测任务包括根据所述语音数据的第一语音帧的声学特征,预测所述语音数据的第二语音帧的声学特征;基于所述声学特征预测结果以及所述第二语音帧的真实声学特征,确定声学特征预测损失;以降低所述声学特征预测损失和所述声纹提取模型的身份预测训练损失为目标,对所述声纹提取模型进行参数优化。上述方案训练得到的声纹提取模型能够提取高精度的声纹模型,进而可以支持实现更高精度的声纹识别。

    语音翻译方法、装置、设备及存储介质

    公开(公告)号:CN117808016A

    公开(公告)日:2024-04-02

    申请号:CN202311868951.6

    申请日:2023-12-28

    Inventor: 占萌萌 刘俊华

    Abstract: 本申请涉及语言翻译,本申请提供一种语音翻译方法、装置、设备及存储介质,所述方法在一个问询周期内,开始一个对话,通过多个翻译数据库分别对用户的源语音数据进行翻译,得到多个第一翻译文本,基于投票机制,选出待翻译的所述第一翻译文本;通过对应的翻译数据库对所述第一翻译文本进行翻译,得到多个第二翻译文本,基于投票机制,选出翻译结果文本,同时淘汰在翻译所述第一翻译文本、所述第二翻译文本时两者均与其他翻译数据库翻译的结果不同的翻译数据库;开始下一对话,重复投票回合,直至多个翻译数据库输出的翻译结果文本重复率达到预定数,停止投票机制,翻译数据库直接输出翻译结果文本。

    一种翻译质量的确定方法及装置

    公开(公告)号:CN109858042B

    公开(公告)日:2024-02-20

    申请号:CN201811384436.X

    申请日:2018-11-20

    Abstract: 本申请公开了一种翻译质量的确定方法及装置,该方法包括:获取目标文本,该目标文本是对源文本进行翻译后的文本,然后,生成各个文本特征,每一文本特征是根据源文本和/或目标文本生成的与翻译质量相关的特征,最后根据生成的各个文本特征,确定目标文本的翻译质量。可见,本申请根据目标文本对应的各个文本特征来评价其翻译质量,可以保证评价结果的准确性,此外,与现有技术中利用参考译文进行自动评价或直接进行人工评价的方式,节省了大量人力。

    短语对提取方法、装置、电子设备及可读存储介质

    公开(公告)号:CN110245361B

    公开(公告)日:2023-04-18

    申请号:CN201910514293.8

    申请日:2019-06-14

    Inventor: 李亚 刘丹 刘俊华

    Abstract: 本申请提供一种短语对提取方法、装置、电子设备及可读存储介质,所述方法包括:获取源语言文本以及所述源语言文本对应的目标语言文本;从所述源语言文本和所述目标语言文本中提取至少一个候选短语对,每个所述候选短语对中包括一个源语言候选短语和一个目标语言候选短语,所述源语言候选短语和所述目标语言候选短语的语义相同;对所述至少一个候选短语对进行筛选,得到至少一个目标短语对。该方法能够自动从源语言文本和目标语言文本中提取出实际所需要的目标短语对,将该方法应用于基于神经网络的机器翻译系统时,能够使得机器翻译系统的效率得到极大提升。

    翻译方法及相关装置
    37.
    发明授权

    公开(公告)号:CN110705317B

    公开(公告)日:2023-04-07

    申请号:CN201910802302.3

    申请日:2019-08-28

    Abstract: 本申请实施例公开了一种翻译方法及相关装置,方法包括:获取第一语言语音;处理所述第一语言语音得到待翻译的第一文本片段,所述第一文本片段为第一语言语境中的文本,所述第一文本片段至少包括一个未翻译过的文本单元;判断所述第一文本片段是否为第一个文本片段;若是,则根据所述第一文本片段,生成所述第一语言语音在第二语言语境中的第一翻译结果;若否,则获取至少一个第二文本片段;根据至少一个第二文本片段和所述第一文本片段,生成所述第一语言语音在第二语言语境中的第二翻译结果,所述第二文本片段为已有翻译结果对应于所述第一语言语境中的文本片段。通过本申请实施例,可以有效的降低翻译的时延。

    一种翻译模型训练方法、文本翻译方法及相关装置

    公开(公告)号:CN110298046B

    公开(公告)日:2023-04-07

    申请号:CN201910595220.6

    申请日:2019-07-03

    Abstract: 本申请公开了一种翻译模型训练方法、文本翻译方法及相关装置,在该方法中,将至少一个样本文本中输入双向翻译模型,以便根据双向翻译模型的输出结果对双向翻译模型进行参数更新,其中,双向翻译模型的输出结果包括每一样本文本的预测翻译文本以及每一样本文本对应的预测词袋,且该预测词袋是朝着对应样本文本的实际词袋的方向预测得到的,该实际词袋包括对应样本文本的实际翻译文本中的各个不同词,因此,在对模型进行参数更新时,需要基于每一样本文本的预测词袋与其实际词袋之间的差异进行参数更新,使得该实际词袋可以用于指导翻译方向,故而,训练完成的双向翻译模型能够朝着输入样本文本的实际词袋的方向进行准确翻译。

    一种通信辐射源识别方法、装置、设备及存储介质

    公开(公告)号:CN115221918A

    公开(公告)日:2022-10-21

    申请号:CN202210706674.8

    申请日:2022-06-21

    Abstract: 本申请提出一种通信辐射源识别方法、装置、设备及存储介质,该方法包括:获取无线电信号的信号特征;将所述信号特征输入预先训练的通信辐射源识别模型,得到与所述无线电信号对应的通信辐射源识别结果;其中,所述通信辐射源识别模型包括特征重建子网络以及特征分类子网络,所述特征重建子网络通过将无线电信号样本的信号特征分别作为训练样本和训练标签进行特征重建训练得到。该通信辐射源识别方法大大降低了对标注样本的数量要求,能够在少量标注样本条件下达到通信辐射源识别目的,从而使得该方法能够胜任更多的通信辐射源识别任务。

Patent Agency Ranking