-
公开(公告)号:CN113035175A
公开(公告)日:2021-06-25
申请号:CN202110229318.7
申请日:2021-03-02
Applicant: 科大讯飞股份有限公司
IPC: G10L15/06 , G10L15/26 , G06F16/35 , G06F40/126
Abstract: 本申请公开了一种语音文本重写模型构建方法、语音识别方法,先利用样本语音的至少一个样本基础识别文本、样本标准识别文本、样本上文信息以及重写分类实际结果对待训练文本重写模型进行两阶段训练,得到语音文本重写模型,以使该语音文本重写模型具有较好地预测性能,以便在对目标用户输入的待识别语音进行语音识别得到至少一个待校正识别文本之后,可以由该语音文本重写模型根据该至少一个待校正识别文本以及该待识别语音的上文信息进行语音识别文本重写,得到并输出该待识别语音的目标语音识别文本,以使该目标语音识别文本能够更准确地表示出待识别语音携带的语音信息,如此能够提高语音识别准确性。
-
-
公开(公告)号:CN111160043A
公开(公告)日:2020-05-15
申请号:CN201911419048.5
申请日:2019-12-31
Applicant: 科大讯飞股份有限公司
Abstract: 本发明实施例提供一种特征编码方法、装置、电子设备及可读存储介质,获取待分析语句;将所述待分析语句输入至预先训练好的特征编码模型中,获得所述特征编码模型输出的特征编码结果;所述特征编码模型为注意力模块和训练好的生成对抗网络模型中的编码模块共同训练所得到。本发明实施例中的特征编码方法利用注意力模块和训练好的生成对抗网络模型中的编码模块共同训练特征编码模型,提高了特征编码模型的鲁棒性。
-
公开(公告)号:CN111160041A
公开(公告)日:2020-05-15
申请号:CN201911403995.5
申请日:2019-12-30
Applicant: 科大讯飞股份有限公司
Abstract: 本发明实施例提供一种语义理解方法、装置、电子设备和存储介质,其中方法包括:确定待理解文本,以及待理解文本的关键信息;基于关键信息,以及预设知识图谱,确定若干条候选语义路径;将待理解文本以及每一候选语义路径输入至路径相关度模型,得到路径相关度模型输出的待理解文本与每一候选语义路径的相关度;其中,路径相关度模型是基于样本文本、样本文本的样本候选语义路径,以及每一样本候选语义路径的相关标记训练得到的;基于待理解文本与每一候选语义路径的相关度,确定待理解文本的文本语义路径。本发明实施例提供的方法、装置、电子设备和存储介质,能够深层次挖掘待理解文本的语义,提高语义理解精度。
-
公开(公告)号:CN109670035A
公开(公告)日:2019-04-23
申请号:CN201811466899.0
申请日:2018-12-03
Applicant: 科大讯飞股份有限公司
IPC: G06F16/34 , G06F16/332
Abstract: 本申请披露了一种文本摘要生成方法,包括:基于输入文本的内容和输入文本对应领域的业务信息,获取普通生成词和领域词的概率;基于所述普通生成词和领域词的概率以及对应词汇,生成输入文本对应的摘要信息。本申请还披露了一种文本摘要生成方法,包括:基于编码后的输入文本,实时获取输入文本对应的普通生成词、复制词和领域词的概率,基于该三者的概率和对应词汇来获取摘要信息。本申请的方法能够结合相关的业务领域,基于对应的领域库纳入该领域的相关业务信息,提取摘要词,更为准确地总结出相关业务过程的摘要信息;同时,综合多种机制可准确识别关键信息、提高流畅度并避免信息冗余。
-
公开(公告)号:CN109271637A
公开(公告)日:2019-01-25
申请号:CN201811158985.5
申请日:2018-09-30
Applicant: 科大讯飞股份有限公司
IPC: G06F17/27 , G06F16/335 , G06N3/08
Abstract: 本申请提供了一种语义理解方法及装置,获取语义理解对象,依据语义理解对象和语义理解对象的上下文对象,预测主题,并依据语义理解对象、语义理解对象的上下文对象以及主题,确定语义理解对象的语义理解结果。因为将主题和上下文对象均作为语义理解的依据,且主题依据语义理解对象及其上下文对象得到,因此,具有较高的准确性。
-
-
公开(公告)号:CN106844327A
公开(公告)日:2017-06-13
申请号:CN201510907916.X
申请日:2015-12-07
Applicant: 科大讯飞股份有限公司
IPC: G06F17/27
Abstract: 本发明公开了一种文本编码方法及系统,该方法包括:预先构建基于依存句法树的文本编码模型,所述文本编码模型用于描述不同依存关系对应的转换矩阵和偏置项、以及每个词向量映射到隐藏层的转换矩阵和偏置项,相同依存关系对应相同的转换矩阵和偏置项,不同依存关系对应的转换矩阵和/或偏置项不同;接收待编码文本;以句为单位,对所述待编码文本进行依存句法分析,得到待编码文本中各句文本的依存句法树;利用所述文本编码模型及待编码文本中各句文本的依存句法树对待编码文本进行编码,得到编码后的文本。利用本发明,可以提高文本编码的有效性。
-
公开(公告)号:CN106777013A
公开(公告)日:2017-05-31
申请号:CN201611117820.4
申请日:2016-12-07
Applicant: 科大讯飞股份有限公司
Abstract: 本申请提出一种对话管理方法和装置,该对话管理方法包括:获取待处理用户文本数据,以及待处理用户文本数据对应的历史数据;分别对所述待处理用户文本数据和所述历史数据进行特征提取,提取得到所述待处理用户文本数据和所述历史数据分别对应的句子语义特征;根据预先构建的对话管理模型和提取得到的句子语义特征,确定用户意图;根据所述用户意图,反馈与所述待处理用户文本数据对应的响应文本数据。该方法能够高效准确地确定出用户意图,进而高效准确地反馈响应文本数据。
-
-
-
-
-
-
-
-