数据生成方法及装置、电子设备和介质

    公开(公告)号:CN116992112A

    公开(公告)日:2023-11-03

    申请号:CN202310804597.4

    申请日:2023-06-30

    Abstract: 本公开提供了一种数据生成方法、装置、电子设备、计算机可读存储介质和计算机程序产品,涉及人工智能领域,尤其涉及深度学习、自然语言处理技术领域。实现方案为:获取与第一文档类型相对应的多个网页内容,第一文档类型与目标生成任务相对应;获取多个网页内容中每个网页内容的得分,以用于评价相应的网页内容的内容质量、时效性、权威性中的至少一者;基于得分对多个网页内容进行过滤,以获得得分超过预设阈值的至少一个网页内容;对于至少一个网页内容中的每一个:确定该网页内容对应的第二文档类型,第二文档类型为第一文档类型的子类型;以及基于第二文档类型,生成与该网页内容相对应的问题指令,该网页内容作为问题指令所对应的回答信息。

    语音翻译方法、装置、计算机设备和存储介质

    公开(公告)号:CN111310481A

    公开(公告)日:2020-06-19

    申请号:CN202010062844.4

    申请日:2020-01-19

    Abstract: 本申请公开了一种语音翻译方法、装置、计算机设备和存储介质,涉及计算机技术领域的语音技术领域。具体实现方案为:通过获取源语音的第i字符串,其中,i为正整数;将第i字符串输入经过训练的切分模型,判断第i字符串是否为无歧义语义单元;确定第i字符串为无歧义语义单元,则对第i字符串进行翻译以生成第i目标字符串;以及确定第i字符串不为无歧义语义单元,则不对第i字符串进行翻译,直至第i字符串至第i+n字符串的之和为无歧义语义单元时,对第i字符串至第i+n字符串的之和进行翻译,其中,n为正整数。由此,避免了源语音中存在多种释义的字符串翻译错误,从而影响整句翻译的准确度的问题,有利于提高语音翻译的准确度。

    翻译处理方法和装置
    4.
    发明授权

    公开(公告)号:CN110059313B

    公开(公告)日:2021-02-12

    申请号:CN201910266420.7

    申请日:2019-04-03

    Abstract: 本申请提出一种翻译处理方法和装置,其中,方法包括:通过根据第二用户使用的目标语言对第一用户的原始语言文档进行翻译生成目标文档,并将目标文档显示给第二用户;在第一用户对原始语言文档进行讲解的过程中,获取已讲解文档片段的语音信息,并对语音信息进行语义解析,获取已讲解文档片段的语义信息;根据已讲解文档片段的语义信息确定是否对目标文档中未讲解文档片段的翻译内容进行调整。由此,通过实时对已讲解文档片段的语音信息进行解析,获取已讲解文档片段的语义信息来更新未讲解文档片段的翻译内容,提升用户使用体验。

    用于评估翻译质量的方法和装置

    公开(公告)号:CN111027331A

    公开(公告)日:2020-04-17

    申请号:CN201911256622.X

    申请日:2019-12-05

    Abstract: 本公开的实施例公开了用于评估翻译质量的方法和装置。该方法的一具体实施方式包括:获取待评估译文和参考译文;将待评估译文和参考译文输入预先训练的复述编码模型,得到待评估译文和参考译文的语义相似度,其中,复述编码模型是用于计算一对句子是复述句的概率的神经网络;通过句法分析器将待评估译文和参考译文分别分析成两棵句法树;计算两棵句法树的相似度作为待评估译文和参考译文的文本相似度;将语义相似度和文本相似度的加权和作为翻译质量得分。该实施方式通过组合几个指标的得分,能够反映当前译文在语义、句法、词法和整体信息可懂度方面进行综合评估,避免自动评价得分高,但是可懂度较低的情况。

    翻译处理方法和装置
    6.
    发明公开

    公开(公告)号:CN110059313A

    公开(公告)日:2019-07-26

    申请号:CN201910266420.7

    申请日:2019-04-03

    Abstract: 本申请提出一种翻译处理方法和装置,其中,方法包括:通过根据第二用户使用的目标语言对第一用户的原始语言文档进行翻译生成目标文档,并将目标文档显示给第二用户;在第一用户对原始语言文档进行讲解的过程中,获取已讲解文档片段的语音信息,并对语音信息进行语义解析,获取已讲解文档片段的语义信息;根据已讲解文档片段的语义信息确定是否对目标文档中未讲解文档片段的翻译内容进行调整。由此,通过实时对已讲解文档片段的语音信息进行解析,获取已讲解文档片段的语义信息来更新未讲解文档片段的翻译内容,提升用户使用体验。

    用于评估翻译质量的方法和装置

    公开(公告)号:CN111027331B

    公开(公告)日:2022-04-05

    申请号:CN201911256622.X

    申请日:2019-12-05

    Abstract: 本公开的实施例公开了用于评估翻译质量的方法和装置。该方法的一具体实施方式包括:获取待评估译文和参考译文;将待评估译文和参考译文输入预先训练的复述编码模型,得到待评估译文和参考译文的语义相似度,其中,复述编码模型是用于计算一对句子是复述句的概率的神经网络;通过句法分析器将待评估译文和参考译文分别分析成两棵句法树;计算两棵句法树的相似度作为待评估译文和参考译文的文本相似度;将语义相似度和文本相似度的加权和作为翻译质量得分。该实施方式通过组合几个指标的得分,能够反映当前译文在语义、句法、词法和整体信息可懂度方面进行综合评估,避免自动评价得分高,但是可懂度较低的情况。

    语音翻译方法、装置、计算机设备和存储介质

    公开(公告)号:CN111310481B

    公开(公告)日:2021-05-18

    申请号:CN202010062844.4

    申请日:2020-01-19

    Abstract: 本申请公开了一种语音翻译方法、装置、计算机设备和存储介质,涉及计算机技术领域的语音技术领域。具体实现方案为:通过获取源语音的第i字符串,其中,i为正整数;将第i字符串输入经过训练的切分模型,判断第i字符串是否为无歧义语义单元;确定第i字符串为无歧义语义单元,则对第i字符串进行翻译以生成第i目标字符串;以及确定第i字符串不为无歧义语义单元,则不对第i字符串进行翻译,直至第i字符串至第i+n字符串的之和为无歧义语义单元时,对第i字符串至第i+n字符串的之和进行翻译,其中,n为正整数。由此,避免了源语音中存在多种释义的字符串翻译错误,从而影响整句翻译的准确度的问题,有利于提高语音翻译的准确度。

Patent Agency Ranking