情感交互方法及装置、情感交互模型的训练方法及装置

    公开(公告)号:CN114444510A

    公开(公告)日:2022-05-06

    申请号:CN202111604541.1

    申请日:2021-12-24

    Abstract: 本发明提供了一种情感交互方法及装置、情感交互模型的训练方法及装置。该情感交互方法包括:利用情感分析模型对历史交互信息进行情感分析,获取历史交互信息对应的情感信息,其中,情感信息包括情感类别;基于历史交互信息和情感信息,利用策略确定模型确定当前回复信息需要采用的情感交互策略;基于历史交互信息和情感交互策略,利用回复生成模型生成当前回复信息,能够使对话系统具备情感交互能力,促进对话系统与用户的深入交流。

    翻译模型的训练方法、翻译方法、电子设备、存储介质

    公开(公告)号:CN112699690A

    公开(公告)日:2021-04-23

    申请号:CN202011591157.8

    申请日:2020-12-29

    Inventor: 李亚 刘丹 刘俊华

    Abstract: 本发明提供一种语音翻译模型的训练方法、翻译方法、电子设备、存储介质,语音翻译模型包括级联的语音识别模型以及文本翻译模型,训练方法包括:获取到语音样本数据、语音样本数据的语音识别结果以及文本翻译结果;利用语音样本数据、语音识别结果对初始语音识别模型进行训练,以得到语音识别模型;通过语音识别模型对语音样本数据进行语音预测,得到语音样本数据中每个词的识别概率;利用语音样本数据中每个词的识别概率以及文本翻译结果对初始文本翻译模型进行训练,得到文本翻译模型,语音识别模型以及文本翻译模型级联得到语音翻译模型。通过将语音识别模型和文本翻译模型联合训练,解决分阶段进行语音翻译的方法的错误传递问题。

    智能对话方法及相关装置、设备和存储介质

    公开(公告)号:CN119962624A

    公开(公告)日:2025-05-09

    申请号:CN202411904688.6

    申请日:2024-12-23

    Abstract: 本申请公开了一种智能对话方法及相关装置、设备和存储介质,其中,智能对话方法包括:获取待回复的第一语句;输入第一语句至第一对话模型,以获取第一对话模型的输出语句作为回复第一语句的第二语句;其中,第一对话模型经与参数量多于第一对话模型的第二对话模型基于样本对话数据通过知识蒸馏训练得到,第二对话模型从候选对话集内筛选候选对话数据作为样本对话数据,候选对话数据包括第一样本语句和回复第一样本语句的第二样本语句,第二样本语句为第一样本语句输入至第二对话模型之后的输出语句。上述方案,能够尽可能地减少智能对话的资源需求并缩短智能对话的推理时间。

    问题回答方法及相关装置、设备和存储介质

    公开(公告)号:CN119831046A

    公开(公告)日:2025-04-15

    申请号:CN202411940905.7

    申请日:2024-12-26

    Abstract: 本申请公开了一种问题回答方法及相关装置、设备和存储介质,其中,问题回答方法包括:响应于检测到待回答的问题语句需经日期计算,基于问题语句,生成用于调用日期信源的查询指令,基于查询指令调用日期信源,得到日期查询的反馈结果,并基于问题语句和反馈结果,生成用于执行日期计算的计算机代码,以及基于反馈结果运行计算机代码,得到日期计算的计算结果;至少基于问题语句和计算结果,生成回复问题语句的回答语句。上述方案,能够在尽可能地降低日期信源的建设成本前提下,提升日期计算类问题的回答精度。

    一种文本匹配方法、装置、设备和存储介质

    公开(公告)号:CN114358016B

    公开(公告)日:2024-10-29

    申请号:CN202111630212.4

    申请日:2021-12-28

    Abstract: 本申请公开了一种文本匹配方法、装置及存储介质,该方法包括:获取目标文本中的第一关键词的词语特征、以及若干候选文本中的第二关键词的词语特征,其中,第一关键词和第二关键词为对应文本中属于预设关键词的词语;基于目标文本的词语特征确定目标文本的语义特征,以及,基于各候选文本的词语特征,确定各候选文本的语义特征;基于目标文本与各候选文本关于语义特征的特征相似度,以确定与目标文本匹配的候选文本。通过上述方式,本申请能够提高文本匹配的准确度。

    一种插件检索方法、装置、存储介质及设备

    公开(公告)号:CN117828024A

    公开(公告)日:2024-04-05

    申请号:CN202311872845.5

    申请日:2023-12-29

    Abstract: 本申请公开了一种插件检索方法、装置、存储介质及设备,该方法包括:首先获取待答复的目标问题文本;以及获取待检索的N个候选插件的插件文档;然后将目标问题文本和第i个候选插件的插件文档输入至预先构建的插件检索模型,预测得到目标问题文本和第i个候选插件的插件文档之间的余弦相似度;其中,插件检索模型是基于初始化的双编码模型,利用基于阈值的目标损失函数对样本问题和插件对进行检索训练得到的;接着,从预测得到的所有余弦相似度中筛选出高于预设相似度阈值的余弦相似度,并将其对应的候选插件作为检索到的目标插件。从而提高了插件检索结果的准确率,进而提高了目标用户的交互体验。

    行业代码模型的训练和行业代码处理方法、装置、一体机

    公开(公告)号:CN117251150A

    公开(公告)日:2023-12-19

    申请号:CN202311385096.3

    申请日:2023-10-23

    Abstract: 本发明提供一种行业代码模型的训练和行业代码处理方法、装置、一体机,方法包括:获取初始模型、通用代码模型,以及目标行业的预训练代码模型;分别基于初始模型、通用代码模型和预训练代码模型,对目标行业的样本代码进行处理,得到初始模型的初始输出、通用代码模型的通用输出和预训练代码模型的预训练输出;基于初始输出、通用输出、预训练输出,以及样本代码的代码标签,对初始模型进行参数迭代,得到目标行业的行业代码模型。本发明提供的方法、装置,大大缩减了行业代码模型的训练数据和训练时间,同时也提升了行业代码模型生成的行业代码的可靠性。

    文档问答方法、系统、电子设备及存储介质

    公开(公告)号:CN115905487A

    公开(公告)日:2023-04-04

    申请号:CN202211431023.9

    申请日:2022-11-15

    Abstract: 本发明涉及自然语言处理技术领域,提供一种文档问答方法、装置、系统、电子设备及存储介质,该方法利用粗排模型,得到目标文档库中的多个备选文档,利用精排模型得到每个备选文档与用户问题的相似度,并确定目标文档,进而确定用户问题对应的目标答案。粗排模型与精排模型基于目标领域内的问题文档对集合、第一困难负样本以及第二困难负样本,对基础粗排模型以及基础精排模型进行多轮迭代训练得到。困难负样本的引入,可以有效提升样本质量,解决目标领域的样本数据不足、标注困难的问题,降低模型训练难度,进而使训练得到的粗排模型和精排模型的鲁棒性得到提升,也可以提高目标答案的准确性。

Patent Agency Ranking