-
公开(公告)号:CN114722792B
公开(公告)日:2024-11-01
申请号:CN202210176436.0
申请日:2022-02-24
Applicant: 中国科学技术大学
IPC: G06F40/194 , G06F40/268 , G06F40/284
Abstract: 本发明提供一种端到端实体模糊方法和系统、电子设备、计算机存储介质,该方法包括:获取用户的请求信息;将请求信息分别与多个预设候选信息均进行实体模糊处理,得到多个相似度;取多个相似度中相似度最高的作为实体模糊后的最终相似度;不需要人工计算前缀匹配、后缀匹配、NGram、CLS等人工总结、计算的特征方式,采用模型自主学习特征方式,让模型能够自主学习到更多深层次的特征信息,也即,轻模型工程化的复杂度,并且让模型能够自主的学习更多潜在的、隐藏特征。
-
公开(公告)号:CN112700769B
公开(公告)日:2024-07-05
申请号:CN202011569220.8
申请日:2020-12-26
Applicant: 中国科学技术大学 , 科大讯飞股份有限公司
IPC: G10L15/18 , G10L15/183 , G10L15/26
Abstract: 本申请公开了一种语义理解方法、装置、设备以及计算机可读存储介质,该方法包括:在获取到当前语音段之后,先对该当前语音段进行语音识别,得到当前文本段;再根据该当前文本段和该当前文本段对应的未识别文本段,生成待识别文本段,以便在确定该待识别文本段包括完整性语句之后,对该待识别文本段进行语义理解。其中,因当前语音段是指在当前时刻下实时采集的用户语音,使得本申请提供的语义理解方法能够针对实时采集的用户语音进行实时地语义理解,从而能够实现边采集用户语音边进行语义理解的目的,如此能够提高语义理解的实时性,从而能够提高人机交互设备的反馈实时性。
-
公开(公告)号:CN114722792A
公开(公告)日:2022-07-08
申请号:CN202210176436.0
申请日:2022-02-24
Applicant: 中国科学技术大学
IPC: G06F40/194 , G06F40/268 , G06F40/284
Abstract: 本发明提供一种端到端实体模糊方法和系统、电子设备、计算机存储介质,该方法包括:获取用户的请求信息;将请求信息分别与多个预设候选信息均进行实体模糊处理,得到多个相似度;取多个相似度中相似度最高的作为实体模糊后的最终相似度;不需要人工计算前缀匹配、后缀匹配、NGram、CLS等人工总结、计算的特征方式,采用模型自主学习特征方式,让模型能够自主学习到更多深层次的特征信息,也即,轻模型工程化的复杂度,并且让模型能够自主的学习更多潜在的、隐藏特征。
-
公开(公告)号:CN112686051B
公开(公告)日:2024-05-31
申请号:CN202011572659.6
申请日:2020-12-22
Applicant: 中国科学技术大学 , 科大讯飞股份有限公司
IPC: G06F40/30 , G06F40/279
Abstract: 本发明提供一种语义识别模型训练方法、识别方法、电子设备、存储介质。其中,语义识别模型训练方法包括:建立预置数据库,所述预置数据库包括多个预置问题;利用所述预置问题对初始模型进行训练,以得到初始语义模型;将所述初始语义模型与语言模型进行拼接,以得到所述语义识别模型;其中,所述语言模型用于识别文本中字与字之间的语言学关系;所述初始语义模型用于识别所述文本中字或词在所述文本中的语义含义。以此提高模型语义理解能力。
-
公开(公告)号:CN114970526A
公开(公告)日:2022-08-30
申请号:CN202210667651.0
申请日:2022-06-14
Applicant: 中国科学技术大学
IPC: G06F40/289 , G06F40/247 , G06K9/62 , G06N3/04 , G06N3/08
Abstract: 本发明提供一种文本意图理解的连续学习方法和系统,该方法包括:当需要训练新模型时,获取训练数据;其中,训练数据包括新增标注数据和原模型已经采用的部分历史标注数据;依据新增标注数据和原模型已经采用的部分历史标注数据,构建训练批次数据;依据训练批次数据,以及原模型与新模型之间的分布约束,对新模型进行训练,得到新版本模型;从而通过利用少量历史标注数据,结合新增的标注数据来进行文本意图的连续学习;本申请重点优化文本意图理解中的灾难性遗忘问题,在保证意图分类效果的情况下,降低训练耗时和训练成本。
-
-
-
-