神经机器翻译方法、装置、电子设备及介质

    公开(公告)号:CN117034968B

    公开(公告)日:2024-02-02

    申请号:CN202311304326.9

    申请日:2023-10-10

    Abstract: 本发明提供一种神经机器翻译方法、装置、电子设备及介质,属于机器翻译技术领域。该方法应用于机器翻译模型,机器翻译模型包括编码器和解码器,该方法包括:识别待翻译的源语言句子对应的目标翻译规则模板,所述目标翻译规则模板包括第一源端模板、第一目标端模板和第一源端变量片段;基于第一约束提示序列和待翻译的源语言句子,得到编码器的输入;基于第一约束提示序列和解码器的初始输入序列,得到解码器的输入;所述第一约束提示序列为依次拼接所述第一源端模板、所述第一源端变量片段和所述第一目标端模板后得到的;基于编码器的输入和解码器的输入,得到机器翻译模型输出的翻译结果。本发明提供的神经机器翻译方法,可以提高翻译准确性。

    神经机器翻译方法、装置、电子设备及介质

    公开(公告)号:CN117034968A

    公开(公告)日:2023-11-10

    申请号:CN202311304326.9

    申请日:2023-10-10

    Abstract: 本发明提供一种神经机器翻译方法、装置、电子设备及介质,属于机器翻译技术领域。该方法应用于机器翻译模型,机器翻译模型包括编码器和解码器,该方法包括:识别待翻译的源语言句子对应的目标翻译规则模板,所述目标翻译规则模板包括第一源端模板、第一目标端模板和第一源端变量片段;基于第一约束提示序列和待翻译的源语言句子,得到编码器的输入;基于第一约束提示序列和解码器的初始输入序列,得到解码器的输入;所述第一约束提示序列为依次拼接所述第一源端模板、所述第一源端变量片段和所述第一目标端模板后得到的;基于编码器的输入和解码器的输入,得到机器翻译模型输出的翻译结果。本发明提供的神经机器翻译方法,可以提高翻译准确性。

    文本翻译方法、装置、电子设备及存储介质

    公开(公告)号:CN116882423B

    公开(公告)日:2023-11-17

    申请号:CN202311143071.2

    申请日:2023-09-06

    Abstract: 本发明提供一种文本翻译方法、装置、电子设备及存储介质,应用于机器翻译技术领域,该方法包括:获取待翻译文本的第一文本序列,所述第一文本序列包括至少两个相邻语句和每两个相邻语句之间的句间关系分隔符;确定所述第一文本序列中每个词段的向量,得到第一向量序列;确定所述至少两个相邻语句的句间关系向量,并将所述第一向量序列中句间关系分隔符的向量更新为所述句间关系向量,得到第二向量序列;基于所述第二向量序列确定所述待翻译文本的译文文本;其中,所述句间关系向量用于表示所述至少两个相邻语句的关联关系。

    文本翻译方法、装置、电子设备及存储介质

    公开(公告)号:CN116882423A

    公开(公告)日:2023-10-13

    申请号:CN202311143071.2

    申请日:2023-09-06

    Abstract: 本发明提供一种文本翻译方法、装置、电子设备及存储介质,应用于机器翻译技术领域,该方法包括:获取待翻译文本的第一文本序列,所述第一文本序列包括至少两个相邻语句和每两个相邻语句之间的句间关系分隔符;确定所述第一文本序列中每个词段的向量,得到第一向量序列;确定所述至少两个相邻语句的句间关系向量,并将所述第一向量序列中句间关系分隔符的向量更新为所述句间关系向量,得到第二向量序列;基于所述第二向量序列确定所述待翻译文本的译文文本;其中,所述句间关系向量用于表示所述至少两个相邻语句的关联关系。

    异常账号检测方法、装置、电子设备及存储介质

    公开(公告)号:CN116882409A

    公开(公告)日:2023-10-13

    申请号:CN202311154862.5

    申请日:2023-09-08

    Inventor: 亢晓勉 宗成庆

    Abstract: 本发明提供一种异常账号检测方法、装置、电子设备及存储介质,应用于社交媒体分析技术领域。该方法包括:获取待测账号的账号信息;根据所述账号信息确定所述待测账号的序列特征、文本特征以及数值特征;将所述序列特征、所述文本特征以及所述数值特征进行特征融合处理,得到所述待测账号的目标表示向量;基于所述目标表示向量检测所述待测账号是否为异常账号;其中,所述序列特征用于表示所述待测账号的发帖内容变化趋势和发帖数量变化趋势;所述文本特征用于表示与所述待测账号相关的文本内容的特征,所述数值特征用于表示所述待测账号的热度和关注度。

    多语言对话状态追踪模型的训练方法及装置

    公开(公告)号:CN117149987B

    公开(公告)日:2024-02-13

    申请号:CN202311426764.2

    申请日:2023-10-31

    Abstract: 本发明属于自然语言处理技术领域,提供了一种多语言对话状态追踪模型的训练方法及装置,该多语言对话状态追踪模型的训练方法包括:获取源语言数据;基于多语词典对多个对话上下文信息进行语码转换,得到语码转换对话上下文信息;以语码转换对话上下文信息为训练样本,以第一函数为训练损失函数,对多语言训练模型进行多任务联合训练,得到多语言对话状态追踪模型。本发明所述方法通过设计多种微调任务,能够构建有效的多语言生成式对话状态追踪模型,使得模型具备对不同语言对话上下文的理解能力,提高了多语言对话状态追踪性能。

    语义约束机器翻译方法、装置、电子设备及存储介质

    公开(公告)号:CN115879480A

    公开(公告)日:2023-03-31

    申请号:CN202211406961.3

    申请日:2022-11-10

    Abstract: 本发明提供一种语义约束机器翻译方法、装置、电子设备及存储介质,其中语义约束机器翻译方法,包括:获取源端语言篇章文本在目标端语言中的目标约束词序列;将源端语言篇章文本和目标约束词序列输入至预设机器翻译模型中进行翻译,输出源端语言篇章文本的机器翻译结果;其中,预设机器翻译模型包括对源端语言篇章文本和目标约束词序列对应的目标词向量矩阵先进行多层编解码、后进行上下文‑约束词解码,并基于顶层解码器输出的结果和上下文‑约束词解码的结果确定机器翻译结果。使用本发明通过充分利用约束词和上下文之间的语义信息的交互关系的方式,能够大幅提高机器翻译模型性能和机器翻译模型的整体翻译质量。

    层次化文本主题分割方法
    10.
    发明公开

    公开(公告)号:CN108984520A

    公开(公告)日:2018-12-11

    申请号:CN201810629577.7

    申请日:2018-06-19

    Inventor: 宗成庆 亢晓勉

    Abstract: 本发明涉及语言处理技术领域,并提出了一种层次化文本主题分割方法,旨在解决在文本主题分割中,忽视文本整体结构,无法利用层次化文本结构信息进行主题分割的技术问题。为此目的,本发明中的层次化文本主题分割方法包括:根据预设的标点符号对待分割文本进行切分,得到包含多个句子的句子集合;利用预先构建的词向量生成上述句子集合中每个句子对应的句向量;按照上述每个句子在上述待分割文本中出现的顺序,依次根据每个句子对应的句向量对预设的子主题向量进行更新;利用更新后的子主题向量计算在每个句子处进行主题分割的概率,并根据上述概率选择性地分割上述待分割文本。本发明可以快速、准确的对文本进行层次化分割。

Patent Agency Ranking