-
公开(公告)号:CN106710588A
公开(公告)日:2017-05-24
申请号:CN201611185200.4
申请日:2016-12-20
Applicant: 科大讯飞股份有限公司
Abstract: 本申请提出一种语音数据句类识别方法和装置及系统,该方法包括:接收待识别的语音数据;获取所述语音数据的句类识别特征,所述句类识别特征包括如下项中的至少一项:声学句类识别特征,语义句类识别特征;根据预先构建的句类识别模型和所述句类识别特征,识别所述语音数据的句类,所述句类识别模型根据获取的语音数据样本的句类识别特征构建得到。该方法能够解决依据规则识别句类的局限性,扩展使用范围,并且可以提高识别准确度。
-
公开(公告)号:CN106557465A
公开(公告)日:2017-04-05
申请号:CN201611033877.6
申请日:2016-11-15
Applicant: 科大讯飞股份有限公司
IPC: G06F17/27
Abstract: 本申请公开了一种词权重类别的获得方法及装置,方法包括:获得目标词;提取所述目标词的词特征,所述词特征包括词向量及互信息;利用预设的词集分类器根据所述词向量及互信息,对所述目标词进行分类,得到所述目标词的初始权重类别;其中,所述词集分类器是对历史语料集合通过语料词特征提取进行构建得到。本申请通过预先基于历史语料集合的语料词特征构建词集分类器,进而在对目标词进行分类时,首先提取目标词的词向量及互信息等词特征,进而再利用词集分类器根据这些词特征对目标词进行分类,进而得到目标词的初始权重类别,无需人工对目标词的权重类别的手动标注,节省大量的人力消耗,从而提高效率。
-
公开(公告)号:CN106710588B
公开(公告)日:2020-06-02
申请号:CN201611185200.4
申请日:2016-12-20
Applicant: 科大讯飞股份有限公司
Abstract: 本申请提出一种语音数据句类识别方法和装置及系统,该方法包括:接收待识别的语音数据;获取所述语音数据的句类识别特征,所述句类识别特征包括如下项中的至少一项:声学句类识别特征,语义句类识别特征;根据预先构建的句类识别模型和所述句类识别特征,识别所述语音数据的句类,所述句类识别模型根据获取的语音数据样本的句类识别特征构建得到。该方法能够解决依据规则识别句类的局限性,扩展使用范围,并且可以提高识别准确度。
-
公开(公告)号:CN106557465B
公开(公告)日:2020-06-02
申请号:CN201611033877.6
申请日:2016-11-15
Applicant: 科大讯飞股份有限公司
IPC: G06F40/284 , G06F40/216
Abstract: 本申请公开了一种词权重类别的获得方法及装置,方法包括:获得目标词;提取所述目标词的词特征,所述词特征包括词向量及互信息;利用预设的词集分类器根据所述词向量及互信息,对所述目标词进行分类,得到所述目标词的初始权重类别;其中,所述词集分类器是对历史语料集合通过语料词特征提取进行构建得到。本申请通过预先基于历史语料集合的语料词特征构建词集分类器,进而在对目标词进行分类时,首先提取目标词的词向量及互信息等词特征,进而再利用词集分类器根据这些词特征对目标词进行分类,进而得到目标词的初始权重类别,无需人工对目标词的权重类别的手动标注,节省大量的人力消耗,从而提高效率。
-
-
-