端到端实体模糊方法和系统、电子设备、计算机存储介质

    公开(公告)号:CN114722792B

    公开(公告)日:2024-11-01

    申请号:CN202210176436.0

    申请日:2022-02-24

    Abstract: 本发明提供一种端到端实体模糊方法和系统、电子设备、计算机存储介质,该方法包括:获取用户的请求信息;将请求信息分别与多个预设候选信息均进行实体模糊处理,得到多个相似度;取多个相似度中相似度最高的作为实体模糊后的最终相似度;不需要人工计算前缀匹配、后缀匹配、NGram、CLS等人工总结、计算的特征方式,采用模型自主学习特征方式,让模型能够自主学习到更多深层次的特征信息,也即,轻模型工程化的复杂度,并且让模型能够自主的学习更多潜在的、隐藏特征。

    一种语义理解方法、装置、设备以及计算机可读存储介质

    公开(公告)号:CN112700769B

    公开(公告)日:2024-07-05

    申请号:CN202011569220.8

    申请日:2020-12-26

    Abstract: 本申请公开了一种语义理解方法、装置、设备以及计算机可读存储介质,该方法包括:在获取到当前语音段之后,先对该当前语音段进行语音识别,得到当前文本段;再根据该当前文本段和该当前文本段对应的未识别文本段,生成待识别文本段,以便在确定该待识别文本段包括完整性语句之后,对该待识别文本段进行语义理解。其中,因当前语音段是指在当前时刻下实时采集的用户语音,使得本申请提供的语义理解方法能够针对实时采集的用户语音进行实时地语义理解,从而能够实现边采集用户语音边进行语义理解的目的,如此能够提高语义理解的实时性,从而能够提高人机交互设备的反馈实时性。

    端到端实体模糊方法和系统、电子设备、计算机存储介质

    公开(公告)号:CN114722792A

    公开(公告)日:2022-07-08

    申请号:CN202210176436.0

    申请日:2022-02-24

    Abstract: 本发明提供一种端到端实体模糊方法和系统、电子设备、计算机存储介质,该方法包括:获取用户的请求信息;将请求信息分别与多个预设候选信息均进行实体模糊处理,得到多个相似度;取多个相似度中相似度最高的作为实体模糊后的最终相似度;不需要人工计算前缀匹配、后缀匹配、NGram、CLS等人工总结、计算的特征方式,采用模型自主学习特征方式,让模型能够自主学习到更多深层次的特征信息,也即,轻模型工程化的复杂度,并且让模型能够自主的学习更多潜在的、隐藏特征。

    一种文本意图理解的连续学习方法和系统

    公开(公告)号:CN114970526A

    公开(公告)日:2022-08-30

    申请号:CN202210667651.0

    申请日:2022-06-14

    Abstract: 本发明提供一种文本意图理解的连续学习方法和系统,该方法包括:当需要训练新模型时,获取训练数据;其中,训练数据包括新增标注数据和原模型已经采用的部分历史标注数据;依据新增标注数据和原模型已经采用的部分历史标注数据,构建训练批次数据;依据训练批次数据,以及原模型与新模型之间的分布约束,对新模型进行训练,得到新版本模型;从而通过利用少量历史标注数据,结合新增的标注数据来进行文本意图的连续学习;本申请重点优化文本意图理解中的灾难性遗忘问题,在保证意图分类效果的情况下,降低训练耗时和训练成本。

Patent Agency Ranking