Patent search ap:("杭州海康威视数字技术股份有限公司") AND inv:"陈凯" Page 1

1.

发明授权
音频的分类方法、装置、终端及计算机可读存储介质有权

公开(公告)号：CN111261174B

公开(公告)日：2023-02-17

申请号：CN201811456608.X

申请日：2018-11-30

Applicant: 杭州海康威视数字技术股份有限公司

Inventor： 陈家旭 , 陈凯 , 谢迪 , 浦世亮

IPC: G10L17/26 , G10L15/08 , G06F16/61

Abstract: 本公开是关于一种音频的分类方法、装置、终端及计算机可读存储介质，涉及目标分类领域。该方法包括：对第一音频样本数据集中的第一音频样本进行混合，得到第二音频样本数据集，并可以确定第二音频样本数据集中的每个第二多标签音频样本的标签。然后通过每个第二多标签音频样本以及每个第二多标签音频样本的标签，训练得到第一音频分类模型。因此，当需要对待分类的目标音频样本进行分类时，可以通过第一音频分类模型对目标音频样本进行分类。由于该第一音频分类模型是通过多标签音频样本训练得到的，因此，通过第一音频分类模型可以对多标签音频进行分类，提高了对多标签音频进行分类的准确性。

2.

发明授权
语音识别的方法和装置有权

公开(公告)号：CN110931000B

公开(公告)日：2022-08-02

申请号：CN201811099967.4

申请日：2018-09-20

Applicant: 杭州海康威视数字技术股份有限公司

Inventor： 郝婧 , 陈凯 , 谢迪 , 浦世亮

IPC: G10L15/22 , G10L15/26 , G10L17/04 , G10L17/18 , G10L15/06

Abstract: 本发明公开了一种语音识别的方法和装置，属于语音识别领域。所述方法包括：获取待识别的语音数据；确定所述语音数据对应的音素数据；将所述音素数据，输入预先训练的音素文字转换模型，得到所述语音数据对应的文字数据。采用本发明，可以提高语音数据识别的准确度。

3.

发明公开
语音识别的方法和装置有权

公开(公告)号：CN110931000A

公开(公告)日：2020-03-27

申请号：CN201811099967.4

申请日：2018-09-20

Applicant: 杭州海康威视数字技术股份有限公司

Inventor： 郝婧 , 陈凯 , 谢迪 , 浦世亮

IPC: G10L15/22 , G10L15/26 , G10L17/04 , G10L17/18 , G10L15/06

Abstract: 本发明公开了一种语音识别的方法和装置，属于语音识别领域。所述方法包括：获取待识别的语音数据；确定所述语音数据对应的音素数据；将所述音素数据，输入预先训练的音素文字转换模型，得到所述语音数据对应的文字数据。采用本发明，可以提高语音数据识别的准确度。

4.

发明公开
一种识别模型训练方法及装置审中-实审

公开(公告)号：CN110874553A

公开(公告)日：2020-03-10

申请号：CN201811019880.1

申请日：2018-09-03

Applicant: 杭州海康威视数字技术股份有限公司

Inventor： 陈凯 , 谢迪 , 浦世亮

IPC: G06K9/00 , G06K9/62

Abstract: 本申请实施例提供了一种识别模型训练方法及装置，识别模型训练方法包括：获取序列样本；将序列样本输入识别模型，得到预设前向目标序列的第一概率及预设后向目标序列的第二概率；根据预设前向目标序列及预设后向目标序列，按照同一位置预设后向目标序列中的目标在前、预设前向目标序列中的目标在后的顺序，排列得到前后向目标序列，并计算前后向目标序列的第三概率；根据第一概率、第二概率及第三概率，计算目标函数；根据目标函数，利用预设训练算法，训练识别模型。通过本方案，可以实现识别模型的实时识别。

5.

发明公开
音频的分类方法、装置、终端及计算机可读存储介质有权

公开(公告)号：CN111261174A

公开(公告)日：2020-06-09

申请号：CN201811456608.X

申请日：2018-11-30

Applicant: 杭州海康威视数字技术股份有限公司

Inventor： 陈家旭 , 陈凯 , 谢迪 , 浦世亮

IPC: G10L17/26 , G10L15/08 , G06F16/61

Abstract: 本公开是关于一种音频的分类方法、装置、终端及计算机可读存储介质，涉及目标分类领域。该方法包括：对第一音频样本数据集中的第一音频样本进行混合，得到第二音频样本数据集，并可以确定第二音频样本数据集中的每个第二多标签音频样本的标签。然后通过每个第二多标签音频样本以及每个第二多标签音频样本的标签，训练得到第一音频分类模型。因此，当需要对待分类的目标音频样本进行分类时，可以通过第一音频分类模型对目标音频样本进行分类。由于该第一音频分类模型是通过多标签音频样本训练得到的，因此，通过第一音频分类模型可以对多标签音频进行分类，提高了对多标签音频进行分类的准确性。

Patent Agency Ranking