-
公开(公告)号:CN111261174B
公开(公告)日:2023-02-17
申请号:CN201811456608.X
申请日:2018-11-30
Applicant: 杭州海康威视数字技术股份有限公司
Abstract: 本公开是关于一种音频的分类方法、装置、终端及计算机可读存储介质,涉及目标分类领域。该方法包括:对第一音频样本数据集中的第一音频样本进行混合,得到第二音频样本数据集,并可以确定第二音频样本数据集中的每个第二多标签音频样本的标签。然后通过每个第二多标签音频样本以及每个第二多标签音频样本的标签,训练得到第一音频分类模型。因此,当需要对待分类的目标音频样本进行分类时,可以通过第一音频分类模型对目标音频样本进行分类。由于该第一音频分类模型是通过多标签音频样本训练得到的,因此,通过第一音频分类模型可以对多标签音频进行分类,提高了对多标签音频进行分类的准确性。
-
公开(公告)号:CN110931000B
公开(公告)日:2022-08-02
申请号:CN201811099967.4
申请日:2018-09-20
Applicant: 杭州海康威视数字技术股份有限公司
Abstract: 本发明公开了一种语音识别的方法和装置,属于语音识别领域。所述方法包括:获取待识别的语音数据;确定所述语音数据对应的音素数据;将所述音素数据,输入预先训练的音素文字转换模型,得到所述语音数据对应的文字数据。采用本发明,可以提高语音数据识别的准确度。
-
公开(公告)号:CN110931000A
公开(公告)日:2020-03-27
申请号:CN201811099967.4
申请日:2018-09-20
Applicant: 杭州海康威视数字技术股份有限公司
Abstract: 本发明公开了一种语音识别的方法和装置,属于语音识别领域。所述方法包括:获取待识别的语音数据;确定所述语音数据对应的音素数据;将所述音素数据,输入预先训练的音素文字转换模型,得到所述语音数据对应的文字数据。采用本发明,可以提高语音数据识别的准确度。
-
公开(公告)号:CN110874553A
公开(公告)日:2020-03-10
申请号:CN201811019880.1
申请日:2018-09-03
Applicant: 杭州海康威视数字技术股份有限公司
Abstract: 本申请实施例提供了一种识别模型训练方法及装置,识别模型训练方法包括:获取序列样本;将序列样本输入识别模型,得到预设前向目标序列的第一概率及预设后向目标序列的第二概率;根据预设前向目标序列及预设后向目标序列,按照同一位置预设后向目标序列中的目标在前、预设前向目标序列中的目标在后的顺序,排列得到前后向目标序列,并计算前后向目标序列的第三概率;根据第一概率、第二概率及第三概率,计算目标函数;根据目标函数,利用预设训练算法,训练识别模型。通过本方案,可以实现识别模型的实时识别。
-
公开(公告)号:CN111261174A
公开(公告)日:2020-06-09
申请号:CN201811456608.X
申请日:2018-11-30
Applicant: 杭州海康威视数字技术股份有限公司
Abstract: 本公开是关于一种音频的分类方法、装置、终端及计算机可读存储介质,涉及目标分类领域。该方法包括:对第一音频样本数据集中的第一音频样本进行混合,得到第二音频样本数据集,并可以确定第二音频样本数据集中的每个第二多标签音频样本的标签。然后通过每个第二多标签音频样本以及每个第二多标签音频样本的标签,训练得到第一音频分类模型。因此,当需要对待分类的目标音频样本进行分类时,可以通过第一音频分类模型对目标音频样本进行分类。由于该第一音频分类模型是通过多标签音频样本训练得到的,因此,通过第一音频分类模型可以对多标签音频进行分类,提高了对多标签音频进行分类的准确性。
-
-
-
-