-
公开(公告)号:CN118410868A
公开(公告)日:2024-07-30
申请号:CN202410506658.3
申请日:2024-04-25
Applicant: 科大讯飞股份有限公司
IPC: G06N5/04 , G06N3/045 , G06F40/30 , G06F16/332 , G06F16/34
Abstract: 本申请提出一种问答处理方法、装置、设备及程序产品,该方法包括:获取第一文档以及对应所述第一文档的第一问题;获取所述第一文档的文档摘要,以及,从所述第一文档中获取与所述第一问题相关的文档内容;基于问答基础数据生成对应所述第一问题的答案,其中,所述问答基础数据包括所述第一文档的文档摘要、与所述第一问题相关的文档内容,以及所述第一问题。采用上述方案能够提高问答处理速度,以及提高问题解答准确度。
-
公开(公告)号:CN114492467B
公开(公告)日:2025-05-13
申请号:CN202111675437.1
申请日:2021-12-31
Applicant: 中国科学技术大学 , 科大讯飞股份有限公司
Abstract: 本申请提供了一种容错翻译方法、训练容错翻译模型的方法和装置。该容错翻译方法包括:识别源语言语句对应的多个候选语句;根据所述多个候选语句确定融合候选语句,所述融合候选语句包括所述源语言语句中的第一词对应的多个候选词以及用于指示所述多个候选词的标签信息;利用容错翻译模型对所述融合候选语句进行编码、预挑选和解码,得到目标语言语句。本申请能够提高翻译的容错率和实时性。
-
公开(公告)号:CN114254657B
公开(公告)日:2023-05-30
申请号:CN202111592412.5
申请日:2021-12-23
Applicant: 中国科学技术大学 , 科大讯飞股份有限公司
IPC: G06F40/40 , G06F40/30 , G06F40/211
-
公开(公告)号:CN114254657A
公开(公告)日:2022-03-29
申请号:CN202111592412.5
申请日:2021-12-23
Applicant: 科大讯飞股份有限公司
IPC: G06F40/40 , G06F40/30 , G06F40/211
Abstract: 本申请公开了一种翻译方法及其相关设备,该方法包括:在获取到待处理源文本之后,先从该待处理源文本中抽取主干源文本,以使该主干源文本用于表示该待处理源文本中的核心主干信息;再根据该主干源文本、译文长度描述数据、以及预先构建的压缩翻译模型,确定待使用精简译文,以使该待使用精简译文能够以较少的译文字符表示该待处理源文本所携带的语义信息,如此能够有效地避免译文端词数多于源文端词数的现象,从而能够实现核心含义不损失的前提下缩短翻译文本的长度,进而有利于降低翻译延迟,如此有利于提高翻译效果。
-
公开(公告)号:CN120012924A
公开(公告)日:2025-05-16
申请号:CN202510055799.2
申请日:2025-01-14
Applicant: 科大讯飞股份有限公司
Abstract: 本发明提供一种大语言模型长文本外推方法、装置、电子设备及存储介质,涉及自然语言处理技术领域,获取预设长度的待处理文本;若预设长度大于初始大语言模型的训练文本的序列长度,则基于预设长度以及初始大语言模型的滑动窗口注意力机制的初始窗口尺寸,对滑动窗口注意力机制的初始位置编码进行扩展,并对初始窗口尺寸进行扩展,得到目标大语言模型;最后基于目标大语言模型,对待处理文本进行处理。通过对滑动窗口注意力机制的初始窗口尺寸和初始位置编码同步扩展,使目标大语言模型具备处理更长文本的能力。进而,通过目标大语言模型对待处理文本进行处理,可以保证处理效果,降低推理成本,且处理效果不受待处理文本的预设长度的限制。
-
公开(公告)号:CN115409045A
公开(公告)日:2022-11-29
申请号:CN202211042986.X
申请日:2022-08-29
Applicant: 科大讯飞股份有限公司
Inventor: 林超
Abstract: 本发明提供了一种文档翻译方法、装置、设备及存储介质,其中,文档翻译方法包括:获取待翻译的源语言文档;获取源语言文档包含的各句子分别对应的文档属性信息,其中,文档属性信息为基于对应句子和/或对应句子的上下文句子确定的用于辅助确定对应句子中的词在所述源语言文档中的含义的信息;辅以源语言文档包含的各句子分别对应的文档属性信息,对源语言文档包含的各句子进行翻译,得到源语言文档对应的目标语言译文。本发明提供的文档翻译方法具有较好的文档翻译效果。
-
公开(公告)号:CN114492467A
公开(公告)日:2022-05-13
申请号:CN202111675437.1
申请日:2021-12-31
Applicant: 科大讯飞股份有限公司
Abstract: 本申请提供了一种容错翻译方法、训练容错翻译模型的方法和装置。该容错翻译方法包括:识别源语言语句对应的多个候选语句;根据所述多个候选语句确定融合候选语句,所述融合候选语句包括所述源语言语句中的第一词对应的多个候选词以及用于指示所述多个候选词的标签信息;利用容错翻译模型对所述融合候选语句进行编码、预挑选和解码,得到目标语言语句。本申请能够提高翻译的容错率和实时性。
-
-
-
-
-
-