-
公开(公告)号:CN116547752A
公开(公告)日:2023-08-04
申请号:CN202180080979.6
申请日:2021-11-11
申请人: 谷歌有限责任公司
发明人: 乔尔·肖尔 , 阿兰纳·福斯特·斯洛克姆
IPC分类号: G10L25/30
摘要: 一种用于确定合成语音的方法(600)包括接收表征由用户设备(102)获得的流式音频(118)中的语音的音频数据(120)。该方法还包括使用经训练的自监督模型(210)生成多个音频特征向量(212),每个音频特征向量表示音频数据的一部分的音频特征。该方法还包括使用浅鉴别器模型(222)基于多个音频特征向量中的每个音频特征向量的对应音频特征,生成指示音频数据中合成语音的存在的得分(224)。该方法还包括确定得分是否满足合成语音检测阈值。当得分满足合成语音检测阈值时,该方法包括确定用户设备获得的音频数据中的语音包括合成语音。
-
公开(公告)号:CN109754088A
公开(公告)日:2019-05-14
申请号:CN201811301455.1
申请日:2018-11-02
申请人: 谷歌有限责任公司
发明人: 乔尔·肖尔 , 塞尔吉奥·瓜达拉马·科塔多
CPC分类号: G06K9/6253 , G06F9/448 , G06K9/6273 , G06N3/0454 , G06N3/0472 , G06N3/08 , G06N3/082 , G06N3/084
摘要: 本申请涉及具有用于培训训练生成式对抗网络的模块化基础结构的计算系统。本公开的示例方面涉及提供用于训练生成式对抗网络(GAN)的模块化基础结构的计算系统。例如,模块化基础结构可以包括轻量级库,其被设计为使训练和评估GAN变得容易。用户可以与模块化基础结构交互和/或依赖于模块化基础结构来轻松地训练GAN。根据本公开的一个方面,模块化基础结构可以包括处理在GAN训练过程的各个阶段和其中的操作的多个不同代码集。代码集可以是模块式的。也就是说,代码集可以被设计为独立存在,但是可容易地且直观地组合。因此,用户可以采用一些或所有代码集,或者可以用自定义代码集替换某个代码集,同时仍然生成可行的组合。
-