-
公开(公告)号:CN116186206A
公开(公告)日:2023-05-30
申请号:CN202211418251.2
申请日:2022-11-14
Applicant: 科大讯飞股份有限公司
IPC: G06F16/332 , G06F16/33
Abstract: 本发明提供了一种对话问题生成方法、装置、设备及存储介质,其中,方法包括:获取指定场景中的参考文档以及针对参考文档所展开的对话的历史对话数据;识别历史对话数据所包含的每轮对话的意图,并预测下一轮对话的意图,将识别的意图和预测的意图作为目标意图信息;基于历史对话数据、参考文档以及目标意图信息,生成下一轮对话的答案;基于历史对话数据、参考文档以及下一轮对话的答案,生成下一轮对话的问题。本发明提供的对话问题生成方法可自动生成下一轮对话的问题和答案,即下一轮对话的问答对,本发明提供的对话问题生成方法的泛化能力强,生成问答对的效果稳定。
-
公开(公告)号:CN115879478A
公开(公告)日:2023-03-31
申请号:CN202211679021.1
申请日:2022-12-26
Applicant: 科大讯飞股份有限公司
Abstract: 本发明提供一种意图理解方法、装置、电子设备和存储介质,其中方法包括:获取待理解的文本,以及文本的语义标签树;基于文本的语义特征与语义标签树的图编码特征之间的相关性,对语义特征进行特征增强,得到文本的增强语义特征;基于文本的增强语义特征,对文本进行意图理解。本发明提供的方法、装置、电子设备和存储介质,通过构建待理解的文本的语义标签树,并基于文本的语义特征与语义标签树的图编码特征之间的相关性,对语义特征进行特征增强,达到凸显语义特征中与文本意图相关的特征表示的效果;基于由此得到的增强语义特征进行意图理解,能够保证意图理解的可靠性,尤其能够提高对长难句和多意图句子的意图理解的全面性和精确性。
-
公开(公告)号:CN115080722B
公开(公告)日:2023-02-17
申请号:CN202210995732.3
申请日:2022-08-19
Applicant: 科大讯飞股份有限公司
IPC: G06F16/332 , G06F16/33 , G06F40/279
Abstract: 本申请提供一种问题生成方法、问题生成设备及存储介质,其中,该问题生成方法包括:获取待处理文本;将所述待处理文本进行处理,得到所述待处理文本中的至少一个实体;基于所述至少一个实体依次从数据库搜索所述至少一个实体对应的描述信息;将所述待处理文本、所述至少一个实体及其对应的所述描述信息输入问题生成模型,生成至少一个文本答案及其对应的问题。本申请提供的问题生成方法,能够基于数据库提供的辅助信息使得生成的问答对更加合理,并且与领域的相关度更高,信息更加丰富;除此之外,还能够提取超出规则以外的问答对,通用性更高。
-
公开(公告)号:CN114254649A
公开(公告)日:2022-03-29
申请号:CN202111538138.3
申请日:2021-12-15
Applicant: 科大讯飞股份有限公司
Abstract: 本申请公开了一种模型训练的方法、装置、存储介质及设备,该方法包括获取低资源语料以及所述低资源语料的平行语料,所述平行语料为与所述低资源语料表达相同语义的高资源语料,所述低资源语料包括方言文本或少数民族语言文本,所述高资源语料包括普通话文本;根据所述低资源语料和所述平行语料,构建训练语料;将所述训练语料输入所述语言模型进行模型训练,直至所述语言模型满足训练停止条件。该方法能够提高语言模型对方言或少数民族语言进行语义理解的效果。
-
公开(公告)号:CN109726254B
公开(公告)日:2020-12-18
申请号:CN201811582996.6
申请日:2018-12-24
Applicant: 科大讯飞股份有限公司
IPC: G06F16/28
Abstract: 本申请公开了一种三元组知识库的构建方法及装置,构建了五个数据结构,第一数据结构用于存储了三元组集合中各个三元组中的各个不同第一元素以及用于在第五数据结构中找到该第一元素的相关信息的标识;第二数据结构,用于存储各个不同的第二元素;第三数据结构,用于存储每一第三元素;第四数据结构,用于存储每一第二元素在第二数据结构中的索引、以及每一第三元素在第三数据结构中的第一存储位置;第五数据结构,用于存储每一第一元素对应的第二元素和第三元素的相关信息在第四数据结构中的第二存储位置。可见,由于第一数据结构和第二数据结构中只存储了三元组集合中的不同第一元素和不同第二元素,可以减少对存储内存的占用。
-
公开(公告)号:CN107450725B
公开(公告)日:2020-09-11
申请号:CN201710642541.8
申请日:2017-07-31
Applicant: 科大讯飞股份有限公司
Abstract: 本发明公开了一种人机交互应用平台及方法,该平台包括:技能构建接口模块,用于向开发者提供技能构建接口,以使开发者通过该接口构建技能;模板添加模块,用于接收开发者为所述技能添加的说法模板,所述说法模板中包含一个或多个语义槽,每个语义槽对应一个实体;所述实体包括:静态实体和/或动态实体;实体关联模块,用于获取所述语义槽对应实体的实体数据,以将所述语义槽关联到其对应的实体;所述实体关联模块包括:静态实体关联模块和/或动态实体关联模块。利用该平台开发的人机交互应用可以适用于多种不同的应用场景,提高了应用的灵活性,提高了应用开发效率;而且,可以针对同一应用领域,无需重复开发。
-
公开(公告)号:CN111091011A
公开(公告)日:2020-05-01
申请号:CN201911327989.6
申请日:2019-12-20
Applicant: 科大讯飞股份有限公司
IPC: G06F40/35 , G06K9/62 , G06N3/04 , G06N3/08 , G10L15/06 , G10L15/16 , G10L15/18 , G10L15/22 , G10L15/26
Abstract: 本发明提供一种领域预测方法、领域预测装置及电子设备,领域预测方法包括:确定本轮交互文本;将本轮交互文本和监督信息输入至领域预测模型,得到领域预测模型输出的与本轮交互文本对应的领域概率分布,其中,监督信息为基于上一轮交互文本在语义理解后确定的领域信息,对领域预测模型输出的与上一轮交互文本对应的领域概率分布进行修正获得;基于与本轮交互文本对应的领域概率分布,确定领域预测结果。本发明实施例的领域预测方法,可以极大地提高多轮交互过程中模型预测的准确率,特别是面对多轮交互过程中的简化式交互,可以获得准确的领域预测结果。
-
公开(公告)号:CN109918682A
公开(公告)日:2019-06-21
申请号:CN201910250747.5
申请日:2019-03-29
Applicant: 科大讯飞股份有限公司
Abstract: 本申请公开了一种文本标注方法及装置,该方法包括:在获取到待标注的目标文本后,可以先确定出目标文本所属的特定领域,然后,利用该特定领域内的结构化数据,对目标文本中的各个词条进行语义槽标注。可见,本申请采用的标注依据是目标文本所属的特定领域的结构化数据,由于该结构化数据包含了各个字段以及每一字段下的值,且每个字段通常代表该特定领域内的语义槽,故而,可以利用该结构化数据对目标文本中的各个词条进行语义槽标注,而无需人工标注,从而降低了人工标注成本;此外,由于结构化数据的字段与字段值之间的对应关系是固定的,这使得基于该结构化数据进行语义槽标注,能够保证标注结果的一致性。
-
公开(公告)号:CN109378000A
公开(公告)日:2019-02-22
申请号:CN201811556526.2
申请日:2018-12-19
Applicant: 科大讯飞股份有限公司
IPC: G10L15/22
Abstract: 本申请提供了一种语音唤醒方法、装置、系统、设备、服务器及可读存储介质,语音唤醒方法包括:智能设备接收音频数据,并在设置的缓存区中缓存当前时刻之前预设时长的音频数据,对接收的音频数据进行初步唤醒判断,当判断出接收的音频数据存在指定唤醒词时,将缓存的音频数据和当前以及后续接收的音频数据发送至云端服务器,云端服务器接收智能设备发送的音频数据,基于音频数据中的指定唤醒词和指定唤醒词的上下文信息,确定用户是否在唤醒智能设备;若确定出用户不是在唤醒智能设备,则向智能设备发送禁止唤醒指令。本申请结合指定唤醒词的上下文信息进行唤醒判断,能够减少错误唤醒情况的发生,显著提高语音唤醒的准确率。
-
公开(公告)号:CN109102825A
公开(公告)日:2018-12-28
申请号:CN201810844158.5
申请日:2018-07-27
Applicant: 科大讯飞股份有限公司
Abstract: 本申请公开了一种饮酒状态检测方法及装置,该方法包括:在每轮人机交互过程中,选择一个问题并提供给被检测者,然后获取到被检测者对问题的回答结果,接着,通过对被检测者在至少一轮人机交互中的回答结果的分析,判断出被检测者是否处于饮酒状态。可见,本申请不再局限于只采用酒精浓度的检测方法判断被检测者是否饮酒驾驶,而是采用语音交互的方式,通过对被检测者对语音交互设备提出的问题的回答结果进行分析,判断出被检测者是否处于饮酒状态,从而提高了饮酒状态检测结果的准确率,同时,也无需被检测者下车进行检测,对被检测者要求较低,且检测方式较为便捷。
-
-
-
-
-
-
-
-
-