-
公开(公告)号:CN116264075A
公开(公告)日:2023-06-16
申请号:CN202111539450.4
申请日:2021-12-14
Applicant: 中国电信股份有限公司
Abstract: 本发明的一个方面涉及多采样率语音识别训练方法和装置。公开了一种用于多采样率语音识别装置的训练方法,多采样率语音识别装置至少包括数据扩展模块和语音识别模块,训练方法包括:将多采样率样本语音数据特征输入到数据扩展模块中,以生成所需采样率的语音数据特征;将生成的语音数据特征和所需采样率的样本语音数据特征输入到判别模块中,以判定生成的语音数据特征是否合格;基于判定结果优化数据扩展模块;将被判定为合格的语音数据特征输入语音识别模块进行训练,并计算语音识别模块的损失值;基于判定结果和语音识别模块的损失值优化判别模块;重复以上步骤,直到数据扩展模块生成的语音数据特征全部被判定为合格。
-
公开(公告)号:CN115527520A
公开(公告)日:2022-12-27
申请号:CN202211000156.0
申请日:2022-08-19
Applicant: 中国电信股份有限公司
Abstract: 本公开提供一种异常检测方法、装置以及电子设备和计算机可读存储介质,涉及语音识别技术领域。该异常检测方法包括:获取语音识别文本,语音识别文本是通过语音识别模型对语音数据进行语音识别后获得的,语音识别模型在对语音数据进行语音识别的过程中输出语音识别模型信息;对语音识别文本进行语义特征提取,以获得识别文本语义特征;对语音识别模型信息进行特征提取,以获得语音识别模型特征;将识别文本语义特征和语音识别模型特征融合,以获得异常衡量特征;通过异常检测模型对异常衡量特征进行处理,以确定将语音数据识别为语音识别文本的识别效果。本公开实施例可以准确的确定根据语音数据转录形成的语音识别文本是否正确。
-
公开(公告)号:CN116719944A
公开(公告)日:2023-09-08
申请号:CN202310964923.8
申请日:2023-08-02
Applicant: 中国电信股份有限公司
IPC: G06F16/35 , G06F18/24 , G06N3/0455
Abstract: 本公开是关于一种客服文本分类方法及装置、电子设备以及计算机可读存储介质,涉及人工智能技术领域,可以应用于确定文本分类标签的场景。该方法包括:获取原始文本,由原始文本以及基于原始文本构建得到的第一分类模板文本与第二分类模板文本,生成多个目标训练文本;获取由多个文本编码器组成的初始模型,将多个目标训练文本并行输入至各文本编码器,对初始模型进行预训练处理与参数调整处理,得到对应的目标文本分类模型;将待分类客服文本输入至目标文本分类模型,得到待分类客服文本对应的分类预测结果,以确定目标分类标签。本公开可以采用原始文本对应的模板文本生成模型训练文本,为模型训练引入了外部信息,以进行文本分类任务。
-
-