发明公开
- 专利标题: 音频标注的检错方法和装置
-
申请号: CN202011263694.X申请日: 2020-11-12
-
公开(公告)号: CN112417850A公开(公告)日: 2021-02-26
- 发明人: 张晴晴 , 朱冬 , 贾艳明 , 何淑琳
- 申请人: 北京爱数智慧科技有限公司
- 申请人地址: 北京市海淀区高梁桥斜街59号院1号楼14层1415
- 专利权人: 北京爱数智慧科技有限公司
- 当前专利权人: 北京爱数智慧科技有限公司
- 当前专利权人地址: 北京市海淀区高梁桥斜街59号院1号楼14层1415
- 代理机构: 北京智沃律师事务所
- 代理商 梁晨
- 主分类号: G06F40/232
- IPC分类号: G06F40/232 ; G06F40/242 ; G10L15/26
摘要:
本申请公开了一种音频标注的检错方法,包括:获取音频数据,并将音频数据切分为多个音频片段;对音频片段进行标注,得到初始标注文本;采用通用文本检错模型对初始标注文本进行检错处理,以得到第一标注文本;确定通用文本检错模型的混淆词典;采用文本分类模型识别第一标注文本的领域类别;根据领域类别,采用领域类别对应的领域文本检错模型对第一标注文本进行检错处理,以得到第二标注文本;将通用文本检错模型的混淆词典与领域文本检错模型的第二标注文本作为微调模型的数据库;根据第二标注文本的语义,采用微调模型对第二标注文本进行微调处理,以得到最终的第三标注文本。
公开/授权文献
- CN112417850B 音频标注的检错方法和装置 公开/授权日:2024-07-02