人工智能数据标注任务分配方法以及装置

    公开(公告)号:CN113033718B

    公开(公告)日:2021-10-15

    申请号:CN202110581715.0

    申请日:2021-05-27

    IPC分类号: G06K9/62

    摘要: 本申请公开了一种人工智能数据标注任务分配方法以及装置,涉及人工智能的数据标注领域。方法包括:以人工标注员的个性化信息作为标注终端的特征向量,人工标注员的数量为N;获取待标注数据,待标注数据包括试标数据和量产数据;将试标数据等分为N个试标子数据,向每一个标注终端发送一个试标子数据;在试标子数据经过标注终端标注并返回结果的情况下,经过统计分析模块输出得到待标注数据的特征向量;将量产数据拆分为M个量产子数据;建立带权二分图;计算量产子数据端点‑标注终端端点形成的边的权值,通过KM算法计算出带权二分图的最佳匹配结果,或者,进行聚类处理计算出带权二分图的最佳匹配结果;将量产数据分配给最佳匹配标注终端。

    语音的处理方法和装置
    2.
    发明授权

    公开(公告)号:CN112259081B

    公开(公告)日:2021-04-16

    申请号:CN202011513868.3

    申请日:2020-12-21

    摘要: 本申请公开了一种语音的处理方法,包括:获取原始语音数据;对原始语音数据进行预识别,以获得预识别文本;通过领域场景分类器模型对预识别文本进行处理,以获得预识别文本所属的领域场景信息;通过与领域场景信息对应的领域场景语言模型对预识别结果进行二次识别,以获得最终识别文本;对最终识别文本进行正确性修正和领域场景信息标注,以获得修正后文本;根据领域场景信息,将修正后文本加入到相应的领域场景语言模型的文本数据库中;对领域场景语言模型进行更新;将修正后文本加入到领域场景分类器模型的训练数据库中;对领域场景分类器模型进行迭代训练。能够使得语音识别模型与具体的应用领域场景更有效的匹配,提高语音识别的准确性。

    音频脱敏的方法、装置、电子设备以及可读存储介质

    公开(公告)号:CN112885371B

    公开(公告)日:2021-11-23

    申请号:CN202110039707.3

    申请日:2021-01-13

    IPC分类号: G10L25/03 G10L25/48 G10L15/18

    摘要: 本申请公开了一种音频脱敏的方法、装置、电子设备以及可读存储介质,音频脱敏的方法包括:获取用户的第一音频数据,第一音频数据包括全部音素的发音片段;获取所述第一音频中所述全部音素的发音片段;利用语音合成技术对发音片段进行合成,以得到敏感词汇对应的合成音频;建立与对应的敏感音频特征模型;获取用户的第二音频数据;通过敏感音频特征模型对第二音频数据的声学特征进行相似度匹配;在相似度大于预设值的情况下,对第二音频数据进行内容识别,以得到与第二音频数据对应的内容识别文本;以敏感内容词库作为匹配数据库,判断内容识别文本中是否含有敏感词汇;在内容识别文本中存在敏感词汇时,对敏感词汇对应的语音片段进行替换。

    语音的处理方法和装置
    4.
    发明公开

    公开(公告)号:CN112259081A

    公开(公告)日:2021-01-22

    申请号:CN202011513868.3

    申请日:2020-12-21

    摘要: 本申请公开了一种语音的处理方法,包括:获取原始语音数据;对原始语音数据进行预识别,以获得预识别文本;通过领域场景分类器模型对预识别文本进行处理,以获得预识别文本所属的领域场景信息;通过与领域场景信息对应的领域场景语言模型对预识别结果进行二次识别,以获得最终识别文本;对最终识别文本进行正确性修正和领域场景信息标注,以获得修正后文本;根据领域场景信息,将修正后文本加入到相应的领域场景语言模型的文本数据库中;对领域场景语言模型进行更新;将修正后文本加入到领域场景分类器模型的训练数据库中;对领域场景分类器模型进行迭代训练。能够使得语音识别模型与具体的应用领域场景更有效的匹配,提高语音识别的准确性。

    多模态数据处理方法和装置

    公开(公告)号:CN112256786A

    公开(公告)日:2021-01-22

    申请号:CN202011513749.8

    申请日:2020-12-21

    IPC分类号: G06F16/25 G06F21/60

    摘要: 本申请公开了一种多模态数据处理方法和装置,方法包括:终端获取多模态数据;终端通过特征提取算法对多模态数据进行特征提取,以获得多模态数据的数据特征;终端通过第一转换算法对数据特征进行转换,以得到第一数据特征,其中,第一转换算法用于将多模态数据映射至特定空间;终端将多模态数据的数据特征、数据标签以及终端id传输至服务端;服务端通过与终端id相对应的第二转换算法对第一数据特征进行转换,以得到第二数据特征,其中,第二转换算法用于将不同的特定空间中数据映射至同一空间;服务端以第二数据特征作为输入,以数据标签作为输出,进行多模态表示学习,以对多模态表示学习算法进行训练。

    声纹识别模型训练方法、装置和计算机系统

    公开(公告)号:CN111933155B

    公开(公告)日:2020-12-25

    申请号:CN202010986351.X

    申请日:2020-09-18

    摘要: 本申请公开了一种基于联邦学习技术的声纹识别模型训练方法、装置和计算机系统,联邦学习终端对原始音频信号进行扭曲处理,扭曲处理用于对原始音频信号进行时域上的扭曲处理或者频域上的掩蔽处理;对音频信号进行声学特征的提取;将随机生成的数据编号与提取到的相应声学特征拼接得到信息向量;对拼接后的信息向量进行无损数学特性的加密处理,得到待训练数据,并将待训练数据传输给联邦学习服务端;联邦学习服务端接收待训练数据;将待训练数据中的多个信息向量按照解密规则一一对应地拆解为数据编号和声学特征两部分;以声学特征作为输入,以数据编号作为输出,训练声学向量提取算法,在声学向量提取算法收敛的情况下,完成声学向量提取算法的训练。

    音频处理方法以及装置
    7.
    发明公开

    公开(公告)号:CN112839044A

    公开(公告)日:2021-05-25

    申请号:CN202110039776.4

    申请日:2021-01-13

    IPC分类号: H04L29/06 G06F21/62 G06F21/60

    摘要: 本申请公开了一种音频处理方法以及装置,音频处理方法包括:芯片持续地获取音频数据;芯片在算法库中随机选择出目标特征提取算法,对音频数据的声学特征进行提取,以得到第一声学特征;芯片通过自身的私钥加密算法进行一次加密;芯片使用与数据平台共享的公钥加密算法进行二次加密;芯片将经过二次加密后的目标数据发送至数据平台;数据平台接收目标数据,使用公钥解密算法进行一次解密;数据平台使用私钥解密算法进行二次解密;数据平台重新提取音频数据的第二声学特征;数据平台在第二声学特征与第一声学特征一致的情况下,确定音频数据未被篡改。可以保证音频传输的完整性和保密性。

    多模态数据处理方法和装置

    公开(公告)号:CN112256786B

    公开(公告)日:2021-04-16

    申请号:CN202011513749.8

    申请日:2020-12-21

    IPC分类号: G06F16/25 G06F21/60

    摘要: 本申请公开了一种多模态数据处理方法和装置,方法包括:终端获取多模态数据;终端通过特征提取算法对多模态数据进行特征提取,以获得多模态数据的数据特征;终端通过第一转换算法对数据特征进行转换,以得到第一数据特征,其中,第一转换算法用于将多模态数据映射至特定空间;终端将多模态数据的数据特征、数据标签以及终端id传输至服务端;服务端通过与终端id相对应的第二转换算法对第一数据特征进行转换,以得到第二数据特征,其中,第二转换算法用于将不同的特定空间中数据映射至同一空间;服务端以第二数据特征作为输入,以数据标签作为输出,进行多模态表示学习,以对多模态表示学习算法进行训练。

    一种音频查重的方法和装置
    9.
    发明公开

    公开(公告)号:CN112241467A

    公开(公告)日:2021-01-19

    申请号:CN202011499175.3

    申请日:2020-12-18

    IPC分类号: G06F16/683

    摘要: 本申请实施例公开了一种音频查重的方法和装置,该方法包括:获取目标音频数据;通过话语检测模块将目标音频数据切分为多个音频片段;通过瓶颈特征提取器对音频片段提取瓶颈特征;对瓶颈特征进行降维处理得到每一个音频片段的特征序列;根据特征序列计算目标音频数据与数据库中的音频数据的相似度;根据相似度的计算结果判断目标音频数据是否与数据库中的音频数据重复。在本申请实施例中,无需将音频数据解码为文本即可通过瓶颈特征的提取实现对于音频内容的查重,提高了音频内容查重的速度,可以通用的应用于其他没有语音识别技术的语种中进行音频内容查重。

    声纹识别模型训练方法、装置和计算机系统

    公开(公告)号:CN111933155A

    公开(公告)日:2020-11-13

    申请号:CN202010986351.X

    申请日:2020-09-18

    摘要: 本申请公开了一种基于联邦学习技术的声纹识别模型训练方法、装置和计算机系统,联邦学习终端对原始音频信号进行扭曲处理,扭曲处理用于对原始音频信号进行时域上的扭曲处理或者频域上的掩蔽处理;对音频信号进行声学特征的提取;将随机生成的数据编号与提取到的相应声学特征拼接得到信息向量;对拼接后的信息向量进行无损数学特性的加密处理,得到待训练数据,并将待训练数据传输给联邦学习服务端;联邦学习服务端接收待训练数据;将待训练数据中的多个信息向量按照解密规则一一对应地拆解为数据编号和声学特征两部分;以声学特征作为输入,以数据编号作为输出,训练声学向量提取算法,在声学向量提取算法收敛的情况下,完成声学向量提取算法的训练。