基于差分隐私的联合学习安全聚合方法及装置

    公开(公告)号:CN113268772A

    公开(公告)日:2021-08-17

    申请号:CN202110637052.X

    申请日:2021-06-08

    Abstract: 本发明实施例提供了一种基于差分隐私的联合学习安全聚合方法及装置,应用于服务器,对联合模型和隐私会计值进行初始化;接收目标客户端利用目标客户端本地的用户数据对从服务器中下载的联合模型进行训练获得的本轮沟通的模型更新参数;基于模型更新参数利用差分隐私机制对服务器中的联合模型进行聚合以及加噪处理,得到并利用本轮沟通的更新模型更新服务器本地的联合模型;按照中心极限定理,利用f‑差分隐私机制更新隐私会计值;若当前的隐私会计值大于隐私阈值,将服务器本地的联合模型确定为训练得到的联合模型,否则,执行从多个分别存储有不同用户数据的客户端中,确定参与本轮沟通的目标客户端。本方案可以提高联合学习的安全性。

    四层结构的中文文本正则化体系及实现

    公开(公告)号:CN101661462A

    公开(公告)日:2010-03-03

    申请号:CN200910089359.X

    申请日:2009-07-17

    Inventor: 董远 周涛

    Abstract: 本发明提出了一种全新的适用于中文文本的正则化方法。该方法采用机器学习与规则相结合的方法,大大提高了中文文本正则化的准确率。首先对指定语料库中非标准词进行分析。归纳非标准词的种类,并利用有限自动机的方法构建词典,以用来识别真实文本中的非标准词。然后选取其中占绝大多数的几个类别,选取特征,建立模板,利用条件随机场算法建模,其余部分利用适当规则进行处理,并且给予其子分类,进一步提高非标准词识别的准确率,消去其歧义。同时针对上面识别时遇到的错误,利用错误驱动的规则学习方法,选取最优规则,进一步提高其准确率。最后通过标准读音生成模块产生非标准词的正确读音。基于上述的方法,本发明构思了一种四层结构的中文文本正则化体系。这种四层体系可以大大提高中文文本正则化的准确性和高效性。

    基于韵律短语的韵律结构生成方法

    公开(公告)号:CN101650942A

    公开(公告)日:2010-02-17

    申请号:CN200910091510.3

    申请日:2009-08-26

    Inventor: 董远 周涛

    Abstract: 本发明提出了一种全新的基于韵律短语的分成韵律结构边界生成方法。该方法采用机器学习与规则相结合的方法,大大提高了中文文本韵律结构边界预测的准确率。在输入文件是已经过分词和词性标注的前提下,首先识别韵律短语边界,然后在此基础上结合韵律短语边界信息生成韵律词边界,最后人为地加入一些规则对系统进行整体的修正。在韵律短语和韵律词边界的判断时,分别设计选取特征,建立特征模版,并利用最大熵算法建立韵律短语模型和韵律词模型,分别用于两阶段的韵律边界识别。同时针对最大熵模型在识别时遇到的错误,利用错误驱动的规则学习方法,选取最优规则,进一步提高其准确率。基于上述的方法,本发明构思了一种基于韵律短语的分层韵律结构生成方法,这种方法可以有效提高韵律结构预测的准确性,提高语音合成的自然度。

    四层结构的中文文本正则化体系及实现

    公开(公告)号:CN101661462B

    公开(公告)日:2012-12-12

    申请号:CN200910089359.X

    申请日:2009-07-17

    Inventor: 董远 周涛

    Abstract: 本发明提出了一种全新的适用于中文文本的正则化方法。该方法采用机器学习与规则相结合的方法,大大提高了中文文本正则化的准确率。首先对指定语料库中非标准词进行分析。归纳非标准词的种类,并利用有限自动机的方法构建词典,以用来识别真实文本中的非标准词。然后选取其中占绝大多数的几个类别,选取特征,建立模板,利用条件随机场算法建模,其余部分利用适当规则进行处理,并且给予其子分类,进一步提高非标准词识别的准确率,消去其歧义。同时针对上面识别时遇到的错误,利用错误驱动的规则学习方法,选取最优规则,进一步提高其准确率。最后通过标准读音生成模块产生非标准词的正确读音。基于上述的方法,本发明构思了一种四层结构的中文文本正则化体系。这种四层体系可以大大提高中文文本正则化的准确性和高效性。

    基于差分隐私的联合学习安全聚合方法及装置

    公开(公告)号:CN113268772B

    公开(公告)日:2022-12-20

    申请号:CN202110637052.X

    申请日:2021-06-08

    Abstract: 本发明实施例提供了一种基于差分隐私的联合学习安全聚合方法及装置,应用于服务器,对联合模型和隐私会计值进行初始化;接收目标客户端利用目标客户端本地的用户数据对从服务器中下载的联合模型进行训练获得的本轮沟通的模型更新参数;基于模型更新参数利用差分隐私机制对服务器中的联合模型进行聚合以及加噪处理,得到并利用本轮沟通的更新模型更新服务器本地的联合模型;按照中心极限定理,利用f‑差分隐私机制更新隐私会计值;若当前的隐私会计值大于隐私阈值,将服务器本地的联合模型确定为训练得到的联合模型,否则,执行从多个分别存储有不同用户数据的客户端中,确定参与本轮沟通的目标客户端。本方案可以提高联合学习的安全性。

    基于韵律短语的韵律结构生成方法

    公开(公告)号:CN101650942B

    公开(公告)日:2012-06-27

    申请号:CN200910091510.3

    申请日:2009-08-26

    Inventor: 董远 周涛

    Abstract: 本发明提出了一种全新的基于韵律短语的分成韵律结构边界生成方法。该方法采用机器学习与规则相结合的方法,大大提高了中文文本韵律结构边界预测的准确率。在输入文件是已经过分词和词性标注的前提下,首先识别韵律短语边界,然后在此基础上结合韵律短语边界信息生成韵律词边界,最后人为地加入一些规则对系统进行整体的修正。在韵律短语和韵律词边界的判断时,分别设计选取特征,建立特征模版,并利用最大熵算法建立韵律短语模型和韵律词模型,分别用于两阶段的韵律边界识别。同时针对最大熵模型在识别时遇到的错误,利用错误驱动的规则学习方法,选取最优规则,进一步提高其准确率。基于上述的方法,本发明构思了一种基于韵律短语的分层韵律结构生成方法,这种方法可以有效提高韵律结构预测的准确性,提高语音合成的自然度。

Patent Agency Ranking