音频标注的检错方法和装置

发明公开

请登陆查看更多内容

专利标题： 音频标注的检错方法和装置
申请号： CN202011263694.X

申请日： 2020-11-12
公开(公告)号： CN112417850A

公开(公告)日： 2021-02-26
发明人: 张晴晴 , 朱冬 , 贾艳明 , 何淑琳
申请人： 北京爱数智慧科技有限公司
申请人地址： 北京市海淀区高梁桥斜街59号院1号楼14层1415
专利权人： 北京爱数智慧科技有限公司
当前专利权人： 北京爱数智慧科技有限公司
当前专利权人地址： 北京市海淀区高梁桥斜街59号院1号楼14层1415
代理机构： 北京智沃律师事务所
代理商 梁晨
主分类号： G06F40/232
IPC分类号： G06F40/232 ; G06F40/242 ; G10L15/26

摘要：

本申请公开了一种音频标注的检错方法，包括：获取音频数据，并将音频数据切分为多个音频片段；对音频片段进行标注，得到初始标注文本；采用通用文本检错模型对初始标注文本进行检错处理，以得到第一标注文本；确定通用文本检错模型的混淆词典；采用文本分类模型识别第一标注文本的领域类别；根据领域类别，采用领域类别对应的领域文本检错模型对第一标注文本进行检错处理，以得到第二标注文本；将通用文本检错模型的混淆词典与领域文本检错模型的第二标注文本作为微调模型的数据库；根据第二标注文本的语义，采用微调模型对第二标注文本进行微调处理，以得到最终的第三标注文本。

公开/授权文献

CN112417850B 音频标注的检错方法和装置公开/授权日：2024-07-02

信息查询

中国专利公布公告 Global Dossier Espacenet

IPC分类:

G	物理
G06	计算；推算或计数
G06F	电数字数据处理（基于特定计算模型的计算机系统入G06N）
G06F40/00	处理自然语言数据（语音分析或综合，语音识别G10L）
G06F40/20	.自然语言分析（自然语言的语义分析入G06F40/30）
G06F40/232	..拼写校正，例如拼写差错程序或加元音符