翻译方法、装置、设备及存储介质

    公开(公告)号:CN112668346A

    公开(公告)日:2021-04-16

    申请号:CN202011554126.5

    申请日:2020-12-24

    Abstract: 本申请公开了一种翻译方法、装置、设备及存储介质,本申请同时获取源语言文本、源语言文本的语音信息及源语言文本中每一文本子单元的结构信息,分别对源语言文本、语音信息及结构信息进行特征提取,得到源语言文本对应的文本特征、语音信息对应的语音特征以及源语言文本对应的结构特征,进而基于三种特征进行翻译,得到翻译后的目标语言文本。由此可见,本申请在翻译过程中,将文本、发音及结构作为同一源语言文本的不同认知层面来综合考虑,基于三种特征进行翻译,实现了资源信息的充分利用,同时,由于翻译时所参考的信息更加丰富,既能够提高翻译过程的鲁棒性,又可以提高翻译结果的质量。

    长文本处理方法、相关设备及可读存储介质

    公开(公告)号:CN112527992A

    公开(公告)日:2021-03-19

    申请号:CN202011492809.2

    申请日:2020-12-17

    Abstract: 本申请公开了一种长文本处理方法、相关设备及可读存储介质,对于长度大于预设长度的长文本,可以基于预置的文本处理模型的处理类型,将该长文本分割成多个文本片段,每个文本片段的长度不超过该文本处理模型所能处理最大文本的长度,然后针对文本片段,利用该文本处理模型进行处理,得到该文本片段对应的处理结果,最后基于各个文本片段对应的处理结果,即可得到与该长文本对应的处理结果。上述方案中,通过基于文本处理模型所能处理最大文本的长度,将长文本的处理转化为对多个短文本的处理,基于多个短文本的处理结果得到长文本的处理结果的方式,从而实现了基于文本处理模型对长文本的处理。

    摘要提取和摘要抽取模型训练方法及相关装置、存储介质

    公开(公告)号:CN111241267A

    公开(公告)日:2020-06-05

    申请号:CN202010025465.8

    申请日:2020-01-10

    Abstract: 本申请公开了一种摘要提取和摘要抽取模型训练方法及相关装置、存储介质,其中,摘要提取方法包括:对文本进行分句得到句子列表,按照预设长度对句子列表按照顺序进行窗口划分得到多个窗口,且预设长度为摘要抽取模型支持的最大序列长度,每个窗口包括多个连续的句子且长度小于或等于预设长度,相邻的两个窗口包括至少一个相同的句子,利用摘要抽取模型分别对每个窗口进行预测,得到每个窗口中每个句子的重要性得分,利用每个窗口中每个句子的重要性得分确定文本中每个句子的重要性得分,选择按重要性得分从高到低排序靠前的至少一个句子作为文本的摘要。上述方案,能够提高摘要提取的质量。

    翻译方法、装置、设备及存储介质

    公开(公告)号:CN112668346B

    公开(公告)日:2024-04-30

    申请号:CN202011554126.5

    申请日:2020-12-24

    Abstract: 本申请公开了一种翻译方法、装置、设备及存储介质,本申请同时获取源语言文本、源语言文本的语音信息及源语言文本中每一文本子单元的结构信息,分别对源语言文本、语音信息及结构信息进行特征提取,得到源语言文本对应的文本特征、语音信息对应的语音特征以及源语言文本对应的结构特征,进而基于三种特征进行翻译,得到翻译后的目标语言文本。由此可见,本申请在翻译过程中,将文本、发音及结构作为同一源语言文本的不同认知层面来综合考虑,基于三种特征进行翻译,实现了资源信息的充分利用,同时,由于翻译时所参考的信息更加丰富,既能够提高翻译过程的鲁棒性,又可以提高翻译结果的质量。

    平行句对构建方法、装置、电子设备和存储介质

    公开(公告)号:CN115062633A

    公开(公告)日:2022-09-16

    申请号:CN202210688236.3

    申请日:2022-06-16

    Abstract: 本发明提供一种平行句对构建方法、装置、电子设备和存储介质,其中方法包括:获取第一语句和第二语句,第一语句和第二语句对应不同语种;基于跨语种语言模型,确定第一语句的第一语义特征和第二语句的第二语义特征,跨语种语言模型是基于第一样本语句中各分词与第二样本语句中各分词之间的词义关系训练得到的,第一样本语句和第二样本语句对应不同语种;基于第一语义特征和第二语义特征之间的相似度,构建平行句对,本发明实施例中,应用不同语种的样本语句各自包含的分词之间的词义关系,进行模型训练,能够使训练所得的模型性能更优,在面向稀缺资源语言时,提升了句子嵌入的准确度,精进了平行句对的构建过程,实现了平行句对构建质量的提升。

    翻译质量评估方法、装置、电子设备和存储介质

    公开(公告)号:CN113609875A

    公开(公告)日:2021-11-05

    申请号:CN202110901225.4

    申请日:2021-08-06

    Abstract: 本发明提供一种翻译质量评估方法、装置、电子设备和存储介质,其中方法包括:确定原文文本及其对应的待评估译文文本;对所述待评估译文文本进行句级别翻译质量评估,得到句级评估结果;所述句级评估结果包括所述待评估译文文本的语义忠实度和/或语义流利度;对所述待评估译文文本进行词级别翻译质量评估,得到词级评估结果;所述词级评估结果包括所述待评估译文文本中各个分词的翻译准确度和/或对齐匹配度;基于所述句级评估结果和所述词级评估结果,确定所述待评估译文文本的质量评估结果。本发明提高了翻译质量评估的准确性。

Patent Agency Ranking