-
公开(公告)号:CN105244029B
公开(公告)日:2019-02-26
申请号:CN201510560841.2
申请日:2015-08-28
Applicant: 安徽科大讯飞医疗信息技术有限公司
Abstract: 本发明公开了一种语音识别后处理方法及系统,该方法包括:预先利用语音识别容易出错的词对构建错词检测模型;在接收到待识别语音数据后,对所述语音数据进行语音识别,得到识别结果;依次将所述识别结果中的各词与通用词典中的每个词组成词对,并提取词对中所述识别结果中各词的语义特征及声学特征,以及词典词的声学特征;利用所述词对的语义特征和声学特征、以及所述错词检测模型,依次检测所述识别结果中的各词,得到修正后的识别结果。利用本发明,可以提高语音识别结果后处理的效果,准确修正识别结果中错误词。
-
公开(公告)号:CN106445915B
公开(公告)日:2020-04-28
申请号:CN201610826780.4
申请日:2016-09-14
Applicant: 安徽科大讯飞医疗信息技术有限公司
IPC: G06F40/284 , G06N5/02
Abstract: 本发明提供了一种成词概率的计算方法、新词发现方法及装置,所述计算方法包括:获取文本数据;对所述文本数据进行分词,获得候选词;获取所述候选词的词向量;根据所述候选词的词向量和所述候选词在所述文本数据中的出现顺序,计算经过遗忘后的所述候选词的成词概率。若所述经过遗忘后的候选词的成词概率大于预设阈值,并且所述候选词未出现在词典中,将所述候选词标记为新词。可见,在本发明实施例中,无需人工总结规则,从而减少工作量,而且最终计算出的是经过遗忘后的成词概率,从而提高了新词利用率,节省系统资源。
-