-
公开(公告)号:CN118626620A
公开(公告)日:2024-09-10
申请号:CN202410848166.2
申请日:2024-06-27
Applicant: 科大讯飞股份有限公司
IPC: G06F16/332 , G06F16/33 , G06F16/338 , G06F16/35 , G06N3/045 , G06N5/022 , G06N5/04
Abstract: 本发明提供一种文本生成方法、装置、系统、电子设备和存储介质,其中方法包括:获取用户的输入信息;基于所述输入信息进行信息搜索,得到搜索信息;基于所述输入信息和所述搜索信息进行文本生成,得到目标文本,实现了准确可靠的文本生成,克服了传统方案中在面对未知领域的文本生成时,模型易出现知识幻想的现象,从而导致生成的文本存在错误或与事实存在偏差的缺陷,保证了生成的目标文本的真实性和时效性。
-
公开(公告)号:CN117932016A
公开(公告)日:2024-04-26
申请号:CN202311793037.X
申请日:2023-12-22
Applicant: 科大讯飞股份有限公司
IPC: G06F16/332
Abstract: 本申请公开了一种对话生成方法及相关装置、设备和存储介质,其中,对话生成方法包括:获取目标对象输入的第一对话文本;基于第一对话文本在目标信息源进行搜索,得到与第一对话文本相关的结构化数据;至少将结构化数据输入大语言模型进行处理,得到回应第一对话文本的第二对话文本;其中,大语言模型基于样本结构化数据及样本结构化数据以自然语言描述的样本描述文本进行参数微调得到,大语言模型在以下至少一种任务上执行参数微调:基于样本结构化数据复述样本描述文本、基于样本描述文本生成样本结构化数据。上述方案,能够提升对话回应的准确性,特别是在对话所涉主题超出大语言模型其训练数据时限的情况下。
-
公开(公告)号:CN117688158A
公开(公告)日:2024-03-12
申请号:CN202311828971.0
申请日:2023-12-26
Applicant: 科大讯飞股份有限公司
IPC: G06F16/332 , G06N5/02
Abstract: 本发明提供一种奖励模型的训练方法、答案评价方法、装置和设备,该训练方法包括:获取多个样本对,各样本对包括第一样本和第二样本,第一样本包括样本问题和第一样本答案,第二样本包括样本问题和第二样本答案,第一样本答案的目标分数高于第二样本答案的目标分数,目标分数和知识正确性相关,知识正确性为基于知识图谱中与样本问题匹配的目标答案确定的;针对各样本对,将样本对中的第一样本和第二样本输入初始奖励模型中,得到初始奖励模型输出的第一样本的第一评分和第二样本的第二评分;基于第一评分和第二评分,调整初始奖励模型的模型参数得到奖励模型。本发明可以提高对大语言模型输出文本的事实正确性的识别准确度。
-
公开(公告)号:CN117520490A
公开(公告)日:2024-02-06
申请号:CN202311385141.5
申请日:2023-10-23
Applicant: 科大讯飞股份有限公司
IPC: G06F16/332 , G06F16/35 , G06F40/30 , G06N3/045 , G10L15/26
Abstract: 本申请公开了一种人机对话方法、系统以及相关装置,该方法包括:获取用户选择的目标角色;其中,所述目标角色对应有个性信息,所述个性信息是基于用户输入的多个类别的参考信息得到的;获取用户输入的第一对话内容;至少基于所述目标角色的所述个性信息和所述第一对话内容,生成用于回复所述第一对话内容的第二对话内容。通过上述方式,本申请能够提高虚拟角色与用户进行对话的灵活性。
-
公开(公告)号:CN117114108A
公开(公告)日:2023-11-24
申请号:CN202311030946.8
申请日:2023-08-14
Applicant: 科大讯飞股份有限公司
Abstract: 本发明提供一种问答方法、问答模型训练方法、一体机和存储介质,其中方法包括:获取问询语句;基于自然语言模型和非自然语言模型,分别对问询语句进行解答,得到自然语言模型的自然语言输出和非自然语言模型的非自然语言输出;基于自然语言输出和非自然语言输出,确定融合权重,并基于融合权重,对自然语言输出和非自然语言输出进行加权,得到问询语句对应的答案信息。本发明提供的方法、一体机和存储介质,融合权重的应用使得在答案信息的确定中能够针对性地偏向与问询语句的需求更加贴合的输出,从而得到与问询语句的需求更加贴合、可靠性更强、准确度更高的答案信息,使得无论对于自然语言相关任务还是非自然语言相关任务,效果均能达到预期。
-
公开(公告)号:CN119961260A
公开(公告)日:2025-05-09
申请号:CN202510438933.7
申请日:2025-04-09
Applicant: 科大讯飞股份有限公司
IPC: G06F16/215 , G06F16/26 , G06F11/08
Abstract: 本发明提供一种数据校验方法、装置、电子设备及存储介质,涉及数据处理技术领域,其中方法包括:获取待处理思维导图;对所述待处理思维导图进行切片处理,根据切分结果,获取所述待处理思维导图中的各待处理切片数据的切片特征;将每两个所述待处理切片数据的切片特征输入至分类模型,得到每两个所述待处理切片数据之间的逻辑关系类别;根据每两个所述待处理切片数据之间的逻辑关系类别,对所述待处理思维导图进行校验,得到所述待处理思维导图对应的目标思维导图。本发明实现对思维导图的逻辑关系类别的自动精准判断,显著提高了数据校验的效率与准确性,降低了人为因素对数据校验正确性的影响,确保了思维导图的高质量生成。
-
公开(公告)号:CN119917610A
公开(公告)日:2025-05-02
申请号:CN202411772756.8
申请日:2024-12-04
Applicant: 科大讯飞股份有限公司
IPC: G06F16/3329 , G06N5/04 , G06N20/00
Abstract: 本申请公开了一种智能问答方法及相关装置、设备和存储介质,其中,智能问答方法包括:基于待回复的第一语句进行检索,得到若干检索结果;输入第一语句和若干检索结果至智能对话模型,得到智能对话模型的输出语句作为回复第一语句的第二语句;其中,智能对话模型基于样本数据训练,样本数据包含:第一样本语句、正确回复第一样本语句的第二样本语句和第一样本语句的若干样本检索结果,若干样本检索结果至少包括基于第一样本语句检索的正例检索结果和基于样本负例语句检索的负例检索结果,且替换第一样本语句中实体得到样本负例语句。上述方案,能够在检索增强场景下,提升模型回答的准确性。
-
公开(公告)号:CN119862886A
公开(公告)日:2025-04-22
申请号:CN202411763521.2
申请日:2024-12-03
Applicant: 科大讯飞股份有限公司
IPC: G06F40/295 , G06N3/0895 , G06N3/045 , G06N5/04
Abstract: 本发明涉及自然语言处理技术领域,提供一种嵌套实体识别方法、装置、电子设备和存储介质,其中方法包括:确定识别指令和待识别文本;将识别指令和待识别文本输入至嵌套实体识别模型,得到嵌套实体识别模型输出的识别结果;其中,嵌套实体识别模型是基于样本数据、正样本对和负样本对,以嵌套实体识别任务和对比学习任务作为训练任务联合训练得到的,样本数据包括样本指令以及样本指令对应的样本文本和样本识别结果,正样本对和负样本对是基于样本数据确定的,并用于指导嵌套实体识别模型进行对比学习。本发明通过引入对比学习任务,可以增强嵌套实体识别模型的表征能力,从而提高嵌套实体识别的准确性。
-
公开(公告)号:CN114254125B
公开(公告)日:2025-02-14
申请号:CN202111572284.8
申请日:2021-12-21
Applicant: 科大讯飞股份有限公司
IPC: G06F16/36 , G06F16/3329
Abstract: 本申请提供了一种对话交互方法、装置、设备及存储介质,其中,方法包括:获取用户的对话交互数据;从预先构建的包含若干知识节点的知识图谱中,确定与用户的对话交互数据相关的知识节点,以得到由确定出的知识节点组成的节点集合;基于节点集合中的知识节点,与用户进行对话交互。本申请提供的对话交互方法基于知识图谱能够实现与用户的闲聊交互,由于与用户的交互基于知识图谱进行,因此,交互稳定且可控,由于与用户的交互基于知识图谱中与用户的对话交互数据相关的知识节点进行,因此,交互内容更具丰富性、针对性和知识性,用户体验较好。
-
公开(公告)号:CN118245576A
公开(公告)日:2024-06-25
申请号:CN202311867130.0
申请日:2023-12-28
Applicant: 科大讯飞股份有限公司
IPC: G06F16/332 , G06N3/0455 , G06N3/08
Abstract: 本申请公开了一种信息处理方法、装置、系统及电子设备,应用于对话系统,包括:确定当前对话信息;基于参照信息改写当前对话信息,得到目标对话信息;参照信息包括当前对话信息的关联信息;基于目标对话信息进行信息交互,响应于目标对话信息满足第一约束,基于信息源执行检索步骤,以确定第一交互结果;将目标对话信息和第一交互结果输入预置的大语言模型,得到回复信息。本申请提供的方法在通过改写获得目标对话信息,对目标对话信息基于信息源进行检索,确定第一交互结果,通过预置的大语言模型基于目标对话信息和第一交互结果输出回复信息,提高了对话系统对信息的处理能力,加快了对话系统的反应速度,对系统的算力要求小。
-
-
-
-
-
-
-
-
-