-
公开(公告)号:CN111091011B
公开(公告)日:2023-07-28
申请号:CN201911327989.6
申请日:2019-12-20
Applicant: 科大讯飞股份有限公司
IPC: G06F40/35 , G06F18/214 , G06F18/241 , G06N3/047 , G06N3/09 , G10L15/06 , G10L15/16 , G10L15/18 , G10L15/22 , G10L15/26
Abstract: 本发明提供一种领域预测方法、领域预测装置及电子设备,领域预测方法包括:确定本轮交互文本;将本轮交互文本和监督信息输入至领域预测模型,得到领域预测模型输出的与本轮交互文本对应的领域概率分布,其中,监督信息为基于上一轮交互文本在语义理解后确定的领域信息,对领域预测模型输出的与上一轮交互文本对应的领域概率分布进行修正获得;基于与本轮交互文本对应的领域概率分布,确定领域预测结果。本发明实施例的领域预测方法,可以极大地提高多轮交互过程中模型预测的准确率,特别是面对多轮交互过程中的简化式交互,可以获得准确的领域预测结果。
-
公开(公告)号:CN115984884A
公开(公告)日:2023-04-18
申请号:CN202310130133.X
申请日:2023-02-07
Applicant: 科大讯飞股份有限公司
IPC: G06V30/41 , G06F40/279 , G06F40/216 , G06F40/30
Abstract: 本发明提供一种交互方法、装置、电子设备及存储介质,其中方法包括:获取用户文本,并确定所述用户文本对应的各候选意图;基于所述用户文本,从所述各候选意图的各句式中确定所述各候选意图的目标句式;基于所述用户文本分别与所述各候选意图的目标句式之间的相似度,从所述各候选意图中确定目标意图;基于所述目标意图进行交互。本发明提供的方法、装置、电子设备及存储介质,用户文本分别与各候选意图的目标句式之间的相似度的计算保证了目标意图确定的可靠性和准确性,并且,对于新的意图的句式也能识别,提高了交互的智能性,且方法的执行无需再重新收集相关数据进行训练,极大降低了交互的执行门槛,有助于扩宽交互的应用范围。
-
公开(公告)号:CN111241501B
公开(公告)日:2022-08-05
申请号:CN202010033473.7
申请日:2020-01-13
Applicant: 科大讯飞股份有限公司
IPC: G06F21/31
Abstract: 本发明实施例提供一种身份验证方法、装置、电子设备和存储介质,其中方法包括:确定待验证地图中的待验证存储位置;确定待验证字符串;基于所述待验证存储位置和所述待验证字符串,生成待验证密码,基于待验证密码进行身份验证。本发明实施例提供的方法、装置、电子设备和存储介质,考虑了具象信息和规则性信息便于记忆的特点,用待验证存储位置和待验证字符串相结合的方式进行身份验证,在降低用户记忆难度,提高身份验证一次通过率和验证效率的同时,能够保证身份验证安全性。
-
公开(公告)号:CN114333795A
公开(公告)日:2022-04-12
申请号:CN202111592910.X
申请日:2021-12-23
Applicant: 科大讯飞股份有限公司
IPC: G10L15/06 , G10L15/18 , G10L15/183 , G10L15/26 , G06F40/30
Abstract: 本申请公开了一种语音识别方法和装置、计算机可读存储介质,属于语音交互技术领域。所述语音识别方法先根据语音信息获取第一文本,并获取第一语义;其中第一文本包括第一实体文本序列,第一语义包括与第一实体文本序列对应的第一实体语义,且第一实体语义有对应的实体类型标签;再判断第一语义是否符合预设标准;若是,将第一语义作为语音识别结果;否则,将第一文本中的第一实体文本序列替换为对应的发音编码序列,并为发音编码序列添加实体类型标签,以获得纠错文本;根据发音编码序列获得第二实体文本序列,并使实体类型标签与第二实体文本序列相匹配,以获得第二文本;利用第二文本获取语音识别结果。本申请提高语音识别及语义理解的准确性。
-
公开(公告)号:CN112700769A
公开(公告)日:2021-04-23
申请号:CN202011569220.8
申请日:2020-12-26
Applicant: 科大讯飞股份有限公司
IPC: G10L15/18 , G10L15/183 , G10L15/26
Abstract: 本申请公开了一种语义理解方法、装置、设备以及计算机可读存储介质,该方法包括:在获取到当前语音段之后,先对该当前语音段进行语音识别,得到当前文本段;再根据该当前文本段和该当前文本段对应的未识别文本段,生成待识别文本段,以便在确定该待识别文本段包括完整性语句之后,对该待识别文本段进行语义理解。其中,因当前语音段是指在当前时刻下实时采集的用户语音,使得本申请提供的语义理解方法能够针对实时采集的用户语音进行实时地语义理解,从而能够实现边采集用户语音边进行语义理解的目的,如此能够提高语义理解的实时性,从而能够提高人机交互设备的反馈实时性。
-
公开(公告)号:CN107773982A
公开(公告)日:2018-03-09
申请号:CN201710986387.6
申请日:2017-10-20
Applicant: 科大讯飞股份有限公司
IPC: A63F13/424 , A63F13/87 , G06F17/30 , G10L15/26 , G10L15/22
CPC classification number: A63F13/424 , A63F13/87 , A63F2300/1081 , A63F2300/572 , A63F2300/6072 , G06F17/3061 , G10L15/22 , G10L15/26 , G10L2015/223
Abstract: 本发明实施例提供一种游戏语音交互方法及装置,属于语音识别领域。该方法包括:获取对语音数据进行语音识别后得到的文本数据,将文本数据拆分为文本元素,并将每一文本元素转化为文本向量;基于每一文本向量,生成特征矩阵,并将特征矩阵输入至指令识别模型,输出语音数据对应的操作指令,操作指令为游戏指令或非游戏指令,游戏指令用于操控游戏玩家对应的游戏角色,非游戏指令用于游戏玩家之间互相沟通。由于游戏玩家通过语音输入的方式,除了实现与其它游戏玩家之间互相沟通之外,还可实现对其对应的游戏角色进行操控,从而在便捷游戏玩家操控的同时,拓展了游戏中语音交互的功能,进而在整体层面上提升了游戏玩家的体验。
-
公开(公告)号:CN119864025A
公开(公告)日:2025-04-22
申请号:CN202411970649.6
申请日:2024-12-30
Applicant: 科大讯飞股份有限公司
Abstract: 本申请提出一种语音交互方法、装置、设备、芯片、介质及产品,应用于车辆语音技术领域。其中,该语音交互方法包括:获取语音指令;获取语音指令的上下文信息,上下文信息包括当前的车辆状态信息和历史对话信息,历史对话信息包括车载语音系统在过去时间的多轮对话信息;根据语音指令和上下文信息,生成反馈信息,反馈信息指示在车辆状态信息下是否执行语音指令指示的车辆操作以及与历史对话信息不重复的答复内容;根据反馈信息,输出语音指令对应的答复语音。在车载语音交互场景中,该方案提高了车载语音系统生成的语音回复的准确性和个性化程度。
-
公开(公告)号:CN119807400A
公开(公告)日:2025-04-11
申请号:CN202411760467.6
申请日:2024-12-03
Applicant: 科大讯飞股份有限公司
IPC: G06F16/335 , G06F16/332
Abstract: 本申请公开了一种知识检索方法及相关装置,涉及知识检索技术领域,方法包括:获取目标检索需求文本,采用第一相关度确定方式确定目标资源知识库中各资源知识分别与目标检索需求文本的第一相关度,根据各第一相关度确定与目标检索需求文本最相关的N条资源知识,根据N条资源知识分别对应的资源热度对各第一相关度进行调整,根据各调整后第一相关度从N条资源知识中确定与目标检索需求文本最相关的K条资源知识,采用准确率更高的第二相关度确定方式确定K条资源知识分别与目标检索需求文本的第二相关度,根据各第二相关度从K条资源知识中确定若干条与目标检索需求文本最相关的资源知识。本申请公开的知识检索方法具有较好的检索效果和用户体验。
-
公开(公告)号:CN119319818A
公开(公告)日:2025-01-17
申请号:CN202411673830.0
申请日:2024-11-21
Applicant: 科大讯飞股份有限公司
IPC: B60R16/037
Abstract: 本申请提供一种车辆控制的处理方法、装置、设备、介质及产品,该方法包括:对接收到的用户请求进行驾驶场景分类,得到驾驶场景类别,该驾驶场景类别表征用户当前所处的驾驶环境;获取与驾驶场景类别相关的车辆控制对象的当前状态参数;根据驾驶场景类别和车辆控制对象的当前状态参数,确定对车辆控制对象的控制推荐信息。本申请可以提高车辆控制的智能化程度。
-
公开(公告)号:CN119026685A
公开(公告)日:2024-11-26
申请号:CN202410838459.2
申请日:2024-06-26
Applicant: 科大讯飞股份有限公司
IPC: G06N5/04 , G06Q30/0601
Abstract: 本申请提供了一种人机交互处理方法、装置、设备、产品及系统,该方法包括:获取交互任务信息,所述交互任务信息包括交互目的、用户信息、产品信息以及交互流程,所述交互流程包括用于实现所述交互目的的多个主干流程;根据所述交互任务信息,生成第一任务指令;将所述第一任务指令输入预先训练的第一大语言模型,以使所述第一大语言模型通过执行所述第一任务指令,根据所述交互任务信息与所述目标用户进行交互,向所述目标用户推销所述产品。将本申请提出的技术方案应用于人机交互系统,不仅能够利用包含多个主干流程的交互流程实现对人机交互状态的全局跟踪及控制,无需依赖于复杂的流程图设计,还能够增加对话的自然性和个性化,提高用户体验。
-
-
-
-
-
-
-
-
-