-
公开(公告)号:CN107622769B
公开(公告)日:2021-04-06
申请号:CN201710749358.8
申请日:2017-08-28
Applicant: 科大讯飞股份有限公司
Abstract: 本公开提供一种号码修改方法及装置、存储介质、电子设备。所述方法包括:获取用户输入的号码修改语音数据,所述号码修改语音数据用于对原号码进行号码修改;提取号码修改特征,所述号码修改特征包括所述原号码的特征和所述号码修改语音数据的特征;基于所述号码修改特征,通过预先构建的号码修改模型进行号码修改,获得修改后号码。如此方案,有助于提高号码修改的灵活性,解决了现有技术鲁棒性、可扩展性差的问题,提升了用户体验。
-
公开(公告)号:CN112560497A
公开(公告)日:2021-03-26
申请号:CN202011455490.6
申请日:2020-12-10
Applicant: 科大讯飞股份有限公司
IPC: G06F40/30 , G06F40/211 , G06N3/04 , G06N3/08
Abstract: 本发明实施例提供一种语义理解方法、装置、电子设备和存储介质,该方法包括:确定待理解的文本;将所述文本及其句法结构输入至语义理解模型,得到所述语义理解模型输出的语义理解结果;其中,所述语义理解模型基于所述文本中各个字之间的关系和所述文本的句法结构,确定所述文本中各个分词之间的关系,并基于各个分词之间的关系对所述文本进行语义理解;所述语义理解模型是基于样本文本及其样本句法结构和样本语义理解结构训练得到的。本发明实施例提供的方法、装置、电子设备和存储介质,能够从词层面上提取文本中包含的语义信息,避免了传统的语义理解模型以字为单元进行建模导致语义信息遗漏的问题,提高了语义理解的准确性。
-
公开(公告)号:CN109189894B
公开(公告)日:2021-03-23
申请号:CN201811101470.1
申请日:2018-09-20
Applicant: 科大讯飞股份有限公司
IPC: G06F16/33 , G06F16/332
Abstract: 本申请公开了一种答案抽取方法及装置,该方法包括:利用一个预先构建的文档匹配模型,预测各个待匹配文档分别作为问题答案所属文档时的第二匹配度,在此过程中,便已经预测了每一待匹配文档的每一单位文本作为问题答案时的第一匹配度,基于此,当根据各个第二匹配度,确定出问题答案实际所属的目标文档后,便可以直接利用该目标文档的每一单位文本与问题答案的第一匹配度,从目标文档中抽取答案。可见,本申请只需要一个文档匹配模型便可以实现答案的抽取,不存在文档检索模型和答案抽取模型导致的误差叠加问题,从而提高了答案抽取结果的正确性。
-
公开(公告)号:CN112528679A
公开(公告)日:2021-03-19
申请号:CN202011500085.1
申请日:2020-12-17
Applicant: 科大讯飞股份有限公司
Abstract: 本申请公开了一种意图理解模型训练方法及装置、意图理解方法及装置,该意图理解模型训练方法包括:在获取到目标语言训练数据和辅助语言训练数据之后,先将该目标语言训练数据和该辅助语言训练数据输入意图理解模型,得到该意图理解模型输出的该目标语言训练数据对应的预测意图和该辅助语言训练数据对应的预测意图,并根据该目标语言训练数据对应的预测意图和该辅助语言训练数据对应的预测意图,确定该意图理解模型的模型预测损失;再根据该模型预测损失更新意图理解模型,并返回执行将目标语言训练数据和辅助语言训练数据输入意图理解模型的步骤及其后续步骤,直至达到预设停止条件。如此能够有效地提高意图理解模型的意图理解性能。
-
公开(公告)号:CN112463964A
公开(公告)日:2021-03-09
申请号:CN202011386332.X
申请日:2020-12-01
Applicant: 科大讯飞股份有限公司
IPC: G06F16/35
Abstract: 本申请公开了一种文本分类及模型训练方法、装置、设备及存储介质,本申请首先将训练文本集划分为若干份训练文本子集,并利用每一子集训练对应的初始文本分类模型,进而分别以每一子集为验证集,利用除验证集外其它各子集对应的初始文本分类模型对验证集中每一训练文本进行分类预测,以得到每一训练文本的分类难度,按照分类难度,将训练文本集中各训练文本重新划分为若干份不同分类难度的训练文本子集。本申请文本分类方法为更好的训练目标文本分类模型提供了有力的训练数据支撑,后续可以基于不同分类难度的训练文本子集,按照分类难度由低至高顺序递进式训练目标文本分类模型,解决由于训练文本难度不均衡现象导致的模型训练效果不佳的问题。
-
公开(公告)号:CN108538294B
公开(公告)日:2020-11-17
申请号:CN201810392723.9
申请日:2018-04-27
Applicant: 科大讯飞股份有限公司
IPC: G10L15/22 , G10L15/26 , G10L15/18 , G10L15/197
Abstract: 本申请公开了一种语音交互方法,先判断本次接收语音数据是否具有弱说法属性,若本次接收语音数据具有弱说法属性,则进一步判断本次接收语音数据是指令语音还是噪声语音。由于连续两次识别到同一个噪声语音的可能性极低,以及在上一次语音指令不被响应的情况下,用户很可能再次给出相同或相似的语音指令,基于此,如果本次接收语音数据与上一次接收语音数据在语义上完全相同或近似相同,则可以认为本次接收语音数据是指令语音并对其进行指令响应。可见,对于具有弱说法属性的用户语音,能够判断其是否为指令语音,从而对这类指令语音进行响应,进而提升了用户体验。
-
公开(公告)号:CN107665704B
公开(公告)日:2020-09-11
申请号:CN201610615977.3
申请日:2016-07-29
Applicant: 科大讯飞股份有限公司
Abstract: 本发明公开了一种语音指令检测模型构建方法,该方法包括:确定语音指令检测模型的拓扑结构;收集大量人机交互的语音数据及其对应的识别文本;对所述识别文本中用户提问或回答语句文本进行分词,并以单轮回答或提问为单位,获取分词词串;对所述分词词串中的每个词,依据对话历史信息,依次对各词进行语音指令结束点赋值,并标注业务类别、以及信息槽或状态槽;利用所述识别文本及其赋值信息和标注信息,训练得到语音指令检测模型的参数。本发明还公开了一种语音指令检测方法及系统、以及一种人机交互方法及设备。本发明可以提高语音指令点检测的准确性,进而提高人机交互过程中机器响应的成功率及响应速度。
-
公开(公告)号:CN107515857B
公开(公告)日:2020-08-18
申请号:CN201710774597.9
申请日:2017-08-31
Applicant: 科大讯飞股份有限公司
IPC: G06F40/30
Abstract: 本发明公开了一种基于定制技能的语义理解方法及系统,该方法包括:接收用户请求数据;获取当前定制技能的路径,根据所述路径获取当前定制技能的语义资源;确定所述请求数据属于当前定制技能的说法模板,所述说法模板中包含一个或多个语义槽,每个语义槽对应一个实体;根据所述说法模板确定所述请求数据中的语义槽及对应实体,得到语义理解结果。利用本发明,可以实现对用户请求数据快速、准确的语义理解。
-
公开(公告)号:CN111460120A
公开(公告)日:2020-07-28
申请号:CN202010247124.5
申请日:2020-03-31
Applicant: 河北省讯飞人工智能研究院 , 中科讯飞互联(北京)信息科技有限公司 , 科大讯飞股份有限公司
IPC: G06F16/332 , G06F16/36
Abstract: 本申请提供了一种对话管理方法、装置、设备及存储介质,其中,对话管理方法包括:在获得用户的对话内容后,根据用户的对话内容确定本轮对话是否由用户主导;若本轮对话由用户主导,则根据用户的对话内容,获取符合用户意图的目标话题和该目标话题的话题类型;若本轮对话不由用户主导,则根据用户的对话内容中所包含的实体,确定目标话题和该目标话题的话题类型;根据目标话题和该目标话题的话题类型,生成针对用户的对话内容的回应信息,其中,回应信息为介绍目标话题的信息,或者,由目标话题向另一话题转移的信息。本申请提供的对话管理方法能够提高用户的聊天兴趣,从而提升用户的聊天体验。
-
公开(公告)号:CN111104803A
公开(公告)日:2020-05-05
申请号:CN201911415186.6
申请日:2019-12-31
Applicant: 科大讯飞股份有限公司
IPC: G06F40/30 , G06F40/289
Abstract: 本发明实施例提供一种语义理解处理方法、装置、设备及可读存储介质,对待分析语句进行分词处理,为分词结果设置对应的标签;所述标签包括用于表征通用词性的词性标签和用于表征专用词性的词典标签;将所述标签代入所述待分析语句得到更新后的待分析语句,将所述更新后的待分析语句与预设的匹配规则进行匹配,获得匹配结果;其中,所述匹配规则包括意图和规则,所述规则至少包括通过分隔符标记连接分词形成的N元组;所述规则中的关键词用其对应的所述词典标签表示,所述规则中的非关键词用其本身表示。本发明实施例中的规则支持多种匹配方式,能够满足语义理解规则的泛化需求。
-
-
-
-
-
-
-
-
-