-
公开(公告)号:CN114444510A
公开(公告)日:2022-05-06
申请号:CN202111604541.1
申请日:2021-12-24
Applicant: 科大讯飞股份有限公司
IPC: G06F40/30 , G06F16/35 , G06F40/126 , G06N3/04 , G06N3/08
Abstract: 本发明提供了一种情感交互方法及装置、情感交互模型的训练方法及装置。该情感交互方法包括:利用情感分析模型对历史交互信息进行情感分析,获取历史交互信息对应的情感信息,其中,情感信息包括情感类别;基于历史交互信息和情感信息,利用策略确定模型确定当前回复信息需要采用的情感交互策略;基于历史交互信息和情感交互策略,利用回复生成模型生成当前回复信息,能够使对话系统具备情感交互能力,促进对话系统与用户的深入交流。
-
公开(公告)号:CN112735417A
公开(公告)日:2021-04-30
申请号:CN202011591155.9
申请日:2020-12-29
Applicant: 科大讯飞股份有限公司
Abstract: 本发明提供一种语音翻译方法、电子设备、存储介质。其中,语音翻译方法,包括:在获取待翻译语音数据的过程中对待翻译语音数据进行流式语音识别;对当前流式语音识别进行即时判定,以判定识别的当前识别结果是否触发翻译操作,若是,对当前识别结果进行翻译。其能够降低翻译等待时间,提高翻译效率。
-
公开(公告)号:CN112699690A
公开(公告)日:2021-04-23
申请号:CN202011591157.8
申请日:2020-12-29
Applicant: 科大讯飞股份有限公司
Abstract: 本发明提供一种语音翻译模型的训练方法、翻译方法、电子设备、存储介质,语音翻译模型包括级联的语音识别模型以及文本翻译模型,训练方法包括:获取到语音样本数据、语音样本数据的语音识别结果以及文本翻译结果;利用语音样本数据、语音识别结果对初始语音识别模型进行训练,以得到语音识别模型;通过语音识别模型对语音样本数据进行语音预测,得到语音样本数据中每个词的识别概率;利用语音样本数据中每个词的识别概率以及文本翻译结果对初始文本翻译模型进行训练,得到文本翻译模型,语音识别模型以及文本翻译模型级联得到语音翻译模型。通过将语音识别模型和文本翻译模型联合训练,解决分阶段进行语音翻译的方法的错误传递问题。
-
公开(公告)号:CN119962624A
公开(公告)日:2025-05-09
申请号:CN202411904688.6
申请日:2024-12-23
Applicant: 科大讯飞股份有限公司
IPC: G06N3/096 , G06N3/0495 , G06N3/045 , G06N5/04 , G06F16/3329
Abstract: 本申请公开了一种智能对话方法及相关装置、设备和存储介质,其中,智能对话方法包括:获取待回复的第一语句;输入第一语句至第一对话模型,以获取第一对话模型的输出语句作为回复第一语句的第二语句;其中,第一对话模型经与参数量多于第一对话模型的第二对话模型基于样本对话数据通过知识蒸馏训练得到,第二对话模型从候选对话集内筛选候选对话数据作为样本对话数据,候选对话数据包括第一样本语句和回复第一样本语句的第二样本语句,第二样本语句为第一样本语句输入至第二对话模型之后的输出语句。上述方案,能够尽可能地减少智能对话的资源需求并缩短智能对话的推理时间。
-
公开(公告)号:CN119831046A
公开(公告)日:2025-04-15
申请号:CN202411940905.7
申请日:2024-12-26
Applicant: 科大讯飞股份有限公司
IPC: G06N5/04 , G06N5/022 , G06F16/353 , G06N3/0464 , G06N3/0455
Abstract: 本申请公开了一种问题回答方法及相关装置、设备和存储介质,其中,问题回答方法包括:响应于检测到待回答的问题语句需经日期计算,基于问题语句,生成用于调用日期信源的查询指令,基于查询指令调用日期信源,得到日期查询的反馈结果,并基于问题语句和反馈结果,生成用于执行日期计算的计算机代码,以及基于反馈结果运行计算机代码,得到日期计算的计算结果;至少基于问题语句和计算结果,生成回复问题语句的回答语句。上述方案,能够在尽可能地降低日期信源的建设成本前提下,提升日期计算类问题的回答精度。
-
公开(公告)号:CN114358016B
公开(公告)日:2024-10-29
申请号:CN202111630212.4
申请日:2021-12-28
Applicant: 中国科学技术大学 , 科大讯飞股份有限公司
IPC: G06F40/30 , G06F40/194 , G06F40/126
Abstract: 本申请公开了一种文本匹配方法、装置及存储介质,该方法包括:获取目标文本中的第一关键词的词语特征、以及若干候选文本中的第二关键词的词语特征,其中,第一关键词和第二关键词为对应文本中属于预设关键词的词语;基于目标文本的词语特征确定目标文本的语义特征,以及,基于各候选文本的词语特征,确定各候选文本的语义特征;基于目标文本与各候选文本关于语义特征的特征相似度,以确定与目标文本匹配的候选文本。通过上述方式,本申请能够提高文本匹配的准确度。
-
公开(公告)号:CN117828024A
公开(公告)日:2024-04-05
申请号:CN202311872845.5
申请日:2023-12-29
Applicant: 科大讯飞股份有限公司
Abstract: 本申请公开了一种插件检索方法、装置、存储介质及设备,该方法包括:首先获取待答复的目标问题文本;以及获取待检索的N个候选插件的插件文档;然后将目标问题文本和第i个候选插件的插件文档输入至预先构建的插件检索模型,预测得到目标问题文本和第i个候选插件的插件文档之间的余弦相似度;其中,插件检索模型是基于初始化的双编码模型,利用基于阈值的目标损失函数对样本问题和插件对进行检索训练得到的;接着,从预测得到的所有余弦相似度中筛选出高于预设相似度阈值的余弦相似度,并将其对应的候选插件作为检索到的目标插件。从而提高了插件检索结果的准确率,进而提高了目标用户的交互体验。
-
公开(公告)号:CN117252210A
公开(公告)日:2023-12-19
申请号:CN202311266141.3
申请日:2023-09-27
Applicant: 河北省讯飞人工智能研究院 , 科大讯飞(北京)有限公司 , 科大讯飞股份有限公司
IPC: G06F40/35 , G06F40/166 , G06N3/0455 , G06N3/0464 , G06N3/08 , G06N20/00
Abstract: 本发明提供一种语义补全方法、装置、电子设备及存储介质,其中方法包括:获取待补全语句、在所述待补全语句之前发生的历史对话,以及所述历史对话中历史语句的缺失片段和/或补全语句;基于所述历史语句、所述缺失片段和所述补全语句中的至少两者之间的关系,对所述历史对话进行语义增强,得到增强历史表示;基于所述增强历史表示,对所述待补全语句进行语义补全,历史语句、缺失片段和补全语句中至少两者之间的关系,显式地反映语义补全模式,能反映多轮历史对话下不同粒度语义补全模式,增强对复杂历史对话的语义补全能力,进而提高补全语句的完整性和准确性。
-
公开(公告)号:CN117251150A
公开(公告)日:2023-12-19
申请号:CN202311385096.3
申请日:2023-10-23
Applicant: 科大讯飞股份有限公司
Abstract: 本发明提供一种行业代码模型的训练和行业代码处理方法、装置、一体机,方法包括:获取初始模型、通用代码模型,以及目标行业的预训练代码模型;分别基于初始模型、通用代码模型和预训练代码模型,对目标行业的样本代码进行处理,得到初始模型的初始输出、通用代码模型的通用输出和预训练代码模型的预训练输出;基于初始输出、通用输出、预训练输出,以及样本代码的代码标签,对初始模型进行参数迭代,得到目标行业的行业代码模型。本发明提供的方法、装置,大大缩减了行业代码模型的训练数据和训练时间,同时也提升了行业代码模型生成的行业代码的可靠性。
-
公开(公告)号:CN115905487A
公开(公告)日:2023-04-04
申请号:CN202211431023.9
申请日:2022-11-15
Applicant: 科大讯飞股份有限公司
IPC: G06F16/332 , G06F16/33 , G06F18/22 , G06N3/04 , G06N3/08
Abstract: 本发明涉及自然语言处理技术领域,提供一种文档问答方法、装置、系统、电子设备及存储介质,该方法利用粗排模型,得到目标文档库中的多个备选文档,利用精排模型得到每个备选文档与用户问题的相似度,并确定目标文档,进而确定用户问题对应的目标答案。粗排模型与精排模型基于目标领域内的问题文档对集合、第一困难负样本以及第二困难负样本,对基础粗排模型以及基础精排模型进行多轮迭代训练得到。困难负样本的引入,可以有效提升样本质量,解决目标领域的样本数据不足、标注困难的问题,降低模型训练难度,进而使训练得到的粗排模型和精排模型的鲁棒性得到提升,也可以提高目标答案的准确性。
-
-
-
-
-
-
-
-
-