-
公开(公告)号:CN111783995B
公开(公告)日:2022-11-29
申请号:CN202010537532.4
申请日:2020-06-12
Applicant: 海信视像科技股份有限公司
IPC: G06N20/00
Abstract: 本申请提供的分类规则获取方法及装置,能够将经过SWEM模型分类后的数据作为样本数据,并且分别确定所有类别中的第一衡量指数和第二衡量指数最小的目标类别;第一衡量指数最小,说明该目标类别中的数据可分性差,第二衡量指数最小,说明该第二衡量指数对应的两个目标类别之间的可分性差。进而需要确定出这两个目标类别内重合的目标样本数据,并对目标样本数据的类别进行修改,以使其与其他类别明显区分,形成包含预设分类规则在内的新的分类规则。本申请的技术方案能够根据衡量指数确定需要修改类别的目标样本数据,形成更加具体和准确的分类规则,可应用于多版本迭代的数据集,适用范围比较广。
-
公开(公告)号:CN112632222B
公开(公告)日:2023-02-03
申请号:CN202011559098.6
申请日:2020-12-25
Applicant: 海信视像科技股份有限公司
Abstract: 本申请实施例提供一种终端设备和确定数据所属领域的方法,涉及计算机技术领域,本申请通过深度学习网络模型确定出待分类的文本数据对应的第一分类结果,在对文本数据进行特征抽取后,可以得到文本数据对应的特征向量,并根据文本数据对应的特征向量确定文本数据中是否包含设定的关键信息,当文本数据中包含设定的关键信息时,可以通过机器学习网络模型,根据文本数据对应的特征向量确定文本数据对应的第二分类结果。最后根据文本数据对应的第一分类结果和第二分类结果,确定文本数据所属的领域,从而可以将文本数据分类到准确的领域中。
-
公开(公告)号:CN112329475B
公开(公告)日:2022-05-20
申请号:CN202011212583.6
申请日:2020-11-03
Applicant: 海信视像科技股份有限公司
IPC: G06F40/30 , G06F40/216 , G06N20/00
Abstract: 本申请提供一种语句处理方法及装置,通过在电子设备中设置的数据量较大、计算量较大的深度学习模型对语句进行识别的同时,还通过数据量较小、计算量较小的小样本学习模型对语句进行识别,并在小样本模型的识别结果的概率值大于预设阈值时使用小样本模型的语义类别作为识别结果、在小样本模型的识别结果的概率值小于或等于预设阈值时仍需采用深度学习模型的语义类别作为识别结果,从而提高了对识别新增语义类别的模型进行训练时的速度和效率,进而提高了用户体验。
-
公开(公告)号:CN112908319B
公开(公告)日:2022-10-25
申请号:CN201911229397.0
申请日:2019-12-04
Applicant: 海信视像科技股份有限公司
Inventor: 沈承恩
Abstract: 本申请公开了一种处理信息交互的方法及设备,包括:接收来自通信终端的语音处理指令,对所述语音处理指令携带的语音请求进行识别、分词得到语音语句文本对应的分词集合;获取所述第一用户的历史语音请求处理信息,其中,所述历史语音请求处理信息至少包括历史语音请求对应的业务领域以及业务领域的置信度;基于卷积神经网络文本分类的业务领域定位模型,利用所述语音语句文本对应的分词集合以及所述历史语音请求处理信息,确定候选业务领域的置信度,并根据候选业务领域的置信度确定所述语音语句文本对应的业务领域;根据所述语音语句文本对应的业务领域处理所述第一用户的语音请求。
-
公开(公告)号:CN114187905A
公开(公告)日:2022-03-15
申请号:CN202010880811.0
申请日:2020-08-27
Applicant: 海信视像科技股份有限公司
IPC: G10L15/22 , G10L15/26 , G10L15/18 , G10L15/16 , G10L15/06 , H04N21/422 , G06K9/62 , G06N3/04 , G06N3/08
Abstract: 本申请实施例提供了一种用户意图识别模型的训练方法、服务器及显示设备,训练方法包括:将训练样本集中的样本分为多个训练组,每个所述训练组包括支撑集和查询集;将所述训练组输入用户意图识别模型,分别提取支撑集的样本特征和查询集的样本特征;通过余弦函数计算所述支撑集的样本特征和查询集的样本特征之间的相似度;根据所述相似度计算所述用户意图识别模型的损失函数;通过多个所述训练组优化所述损失函数,直至所述用户意图识别模型收敛。本申请基于小样本分类的方式对用户意图识别模型进行训练,能够充分利用样本数据,提高了用户意图识别模型的泛化性和识别准确性。
-
公开(公告)号:CN112908319A
公开(公告)日:2021-06-04
申请号:CN201911229397.0
申请日:2019-12-04
Applicant: 海信视像科技股份有限公司
Inventor: 沈承恩
Abstract: 本申请公开了一种处理信息交互的方法及设备,包括:接收来自通信终端的语音处理指令,对所述语音处理指令携带的语音请求进行识别、分词得到语音语句文本对应的分词集合;获取所述第一用户的历史语音请求处理信息,其中,所述历史语音请求处理信息至少包括历史语音请求对应的业务领域以及业务领域的置信度;基于卷积神经网络文本分类的业务领域定位模型,利用所述语音语句文本对应的分词集合以及所述历史语音请求处理信息,确定候选业务领域的置信度,并根据候选业务领域的置信度确定所述语音语句文本对应的业务领域;根据所述语音语句文本对应的业务领域处理所述第一用户的语音请求。
-
公开(公告)号:CN114155846A
公开(公告)日:2022-03-08
申请号:CN202010831548.6
申请日:2020-08-18
Applicant: 海信视像科技股份有限公司
IPC: G10L15/18 , G10L15/28 , G10L15/22 , H04N21/439 , H04N21/422
Abstract: 本申请公开了一种语义槽提取方法及显示设备,提高提取语义槽的准确性。该方法包括:响应于用户发送的请求,对所述请求进行深度学习的语义槽位解析,确定第一语义槽;检测所述请求的第一语义槽是否出现错误,如果出现错误,则对所述请求中与第一语义槽对应的内容进行修改,得到修改后的请求;对修改后的请求进行文法语义槽位解析,确定第二语义槽;将所述第一语义槽和第二语义槽结合,得到所述请求的语义槽。
-
公开(公告)号:CN112632222A
公开(公告)日:2021-04-09
申请号:CN202011559098.6
申请日:2020-12-25
Applicant: 海信视像科技股份有限公司
Abstract: 本申请实施例提供一种终端设备和确定数据所属领域的方法,涉及计算机技术领域,本申请通过深度学习网络模型确定出待分类的文本数据对应的第一分类结果,在对文本数据进行特征抽取后,可以得到文本数据对应的特征向量,并根据文本数据对应的特征向量确定文本数据中是否包含设定的关键信息,当文本数据中包含设定的关键信息时,可以通过机器学习网络模型,根据文本数据对应的特征向量确定文本数据对应的第二分类结果。最后根据文本数据对应的第一分类结果和第二分类结果,确定文本数据所属的领域,从而可以将文本数据分类到准确的领域中。
-
公开(公告)号:CN112329475A
公开(公告)日:2021-02-05
申请号:CN202011212583.6
申请日:2020-11-03
Applicant: 海信视像科技股份有限公司
IPC: G06F40/30 , G06F40/216 , G06N20/00
Abstract: 本申请提供一种语句处理方法及装置,通过在电子设备中设置的数据量较大、计算量较大的深度学习模型对语句进行识别的同时,还通过数据量较小、计算量较小的小样本学习模型对语句进行识别,并在小样本模型的识别结果的概率值大于预设阈值时使用小样本模型的语义类别作为识别结果、在小样本模型的识别结果的概率值小于或等于预设阈值时仍需采用深度学习模型的语义类别作为识别结果,从而提高了对识别新增语义类别的模型进行训练时的速度和效率,进而提高了用户体验。
-
公开(公告)号:CN111783995A
公开(公告)日:2020-10-16
申请号:CN202010537532.4
申请日:2020-06-12
Applicant: 海信视像科技股份有限公司
IPC: G06N20/00
Abstract: 本申请提供的分类规则获取方法及装置,能够将经过SWEM模型分类后的数据作为样本数据,并且分别确定所有类别中的第一衡量指数和第二衡量指数最小的目标类别;第一衡量指数最小,说明该目标类别中的数据可分性差,第二衡量指数最小,说明该第二衡量指数对应的两个目标类别之间的可分性差。进而需要确定出这两个目标类别内重合的目标样本数据,并对目标样本数据的类别进行修改,以使其与其他类别明显区分,形成包含预设分类规则在内的新的分类规则。本申请的技术方案能够根据衡量指数确定需要修改类别的目标样本数据,形成更加具体和准确的分类规则,可应用于多版本迭代的数据集,适用范围比较广。
-
-
-
-
-
-
-
-
-