一种模型联合训练的方法和系统

    公开(公告)号:CN113657617B

    公开(公告)日:2024-08-13

    申请号:CN202111077337.9

    申请日:2020-04-23

    Abstract: 本说明书实施例公开了一种模型联合训练的方法及系统。所述方法包括:多个联合训练的参与终端分别基于所述终端自身持有的私有数据联合进行模型训练,多个联合训练的参与终端分别使用基于梯度的优化算法生成各自的梯度;所述多个参与终端分别将所述各自的梯度发送给服务器;所述服务器从多个所述梯度中选取可信任梯度,并且根据选取的所述可信任梯度更新所述联合训练模型的参数;所述样本数据为文本数据、语音数据或者图形数据。

    对象类别的分析方法及装置

    公开(公告)号:CN111461904B

    公开(公告)日:2022-06-21

    申请号:CN202010304997.5

    申请日:2020-04-17

    Abstract: 本说明书一个或多个实施例公开了对象类别的分析方法及装置,用于解决现有技术中对象类别的分析准确度较低的问题。所述方法包括:获取属于目标类别的第一对象对应的第一文本,及,获取第二对象对应的第二文本。利用预先训练的序列到序列模型及词向量集,确定所述第一文本对应的第一文本向量及所述第二文本对应的第二文本向量,所述序列到序列模型为根据具有相关性标签信息的多个样本文本训练得到,各所述样本文本包含多个有序的样本词语。基于所述第一文本向量及所述第二文本向量,确定所述第一文本及所述第二文本之间的相关性信息。根据所述第一文本及所述第二文本之间的相关性信息,确定所述第二对象是否属于所述目标类别。

    分类模型的训练、对象分类方法及装置

    公开(公告)号:CN111178458B

    公开(公告)日:2020-08-14

    申请号:CN202010276683.9

    申请日:2020-04-10

    Inventor: 曹绍升

    Abstract: 本说明书实施例提供一种分类模型的训练、对象分类方法及装置,在训练方法中,获取带分类标签的样本。在嵌入层中,确定样本的特征向量以及分类标签的标签向量。在卷积层中,基于若干不同宽度的卷积窗口,对样本的特征向量进行多次卷积处理,得到多个卷积结果。在池化层中,计算各卷积结果与分类标签的标签向量之间的相似度,并基于计算得到的相似度,确定对应于各卷积结果的注意力权重值。基于对应于各卷积结果的注意力权重值,对各卷积结果进行加权平均池化操作,得到池化结果。将池化结果作为样本的样本表示向量,并至少基于样本表示向量以及分类标签的标签向量,确定预测损失。基于预测损失,调整分类模型的参数。

    用于预测实体间业务关系的模型训练方法及装置

    公开(公告)号:CN111507543A

    公开(公告)日:2020-08-07

    申请号:CN202010466497.1

    申请日:2020-05-28

    Abstract: 本说明书实施例提供一种用于预测实体间业务关系的模型训练方法及装置,利用采集到的实体基础数据构建基础关系图谱,从而利用实体间已知的上下游业务关系,训练包含第一图神经网络和第一分类网络的业务关系预测模型,用于挖掘未知的上下游业务关系。进一步地,本说明书实施例还提供一种实体业务关系图谱的构建方法及装置,通过利用训练后的业务关系预测模型,挖掘出未知的上下游业务关系,进而结合已知的实体间业务关系,构建实体业务关系图谱。更进一步地,本说明书实施例还提供一种实体业务风险的预测方法及装置,基于构建出的实体业务关系图谱,实现对实体节点进行精准地业务风险预测。

    模型训练方法、歌词生成方法、装置、电子设备及介质

    公开(公告)号:CN111428487A

    公开(公告)日:2020-07-17

    申请号:CN202010125311.6

    申请日:2020-02-27

    Inventor: 曹绍升 杨轶斐

    Abstract: 本说明书实施例提供了一种模型训练方法、歌词生成方法、装置、电子设备及介质,该模型训练方法通过样本歌曲的歌词文本得到的样本分词序列,先根据样本分词序列中每个词语出现的频率,对样本分词序列中的词语进行剔除处理,然后基于样本分词序列以及样本分词序列中每个分词的词向量,对长短期记忆网络模型进行训练,得到歌词生成模型,用于自动生成新的歌词文本。

    文本检测方法、相似度计算方法、模型训练方法及装置

    公开(公告)号:CN111221960A

    公开(公告)日:2020-06-02

    申请号:CN201911030483.9

    申请日:2019-10-28

    Inventor: 曹绍升

    Abstract: 本说明书实施例提供一种文本检测方法、相似度计算方法、模型训练方法、装置及设备。获取第二文本以及待检测的第一文本,生成所述第一文本以及所述第二文本中各词语的向量集合,所述向量集合包括所述词语的词向量以及n-元笔画向量,将所述第一文本中各词语、所述第二文本中各词语以及所述向量集合输入到预先训练的文本相似度计算模型,以计算所述第一文本和第二文本的相似度,基于所述相似度以及所述第二文本的类别确定所述第一文本是否为目标类别的文本。基于文本各词语的n元笔画向量计算文本相似度,可以从更粒度地提取词语之间的关联,也解决了预测中出现新词语的问题,可以有效检测测出目标类别的文本。

    用于预测实体间业务关系的模型训练方法及装置

    公开(公告)号:CN111507543B

    公开(公告)日:2022-05-17

    申请号:CN202010466497.1

    申请日:2020-05-28

    Abstract: 本说明书实施例提供一种用于预测实体间业务关系的模型训练方法及装置,利用采集到的实体基础数据构建基础关系图谱,从而利用实体间已知的上下游业务关系,训练包含第一图神经网络和第一分类网络的业务关系预测模型,用于挖掘未知的上下游业务关系。进一步地,本说明书实施例还提供一种实体业务关系图谱的构建方法及装置,通过利用训练后的业务关系预测模型,挖掘出未知的上下游业务关系,进而结合已知的实体间业务关系,构建实体业务关系图谱。更进一步地,本说明书实施例还提供一种实体业务风险的预测方法及装置,基于构建出的实体业务关系图谱,实现对实体节点进行精准地业务风险预测。

    一种风险群组识别方法及装置

    公开(公告)号:CN111738628B

    公开(公告)日:2020-12-08

    申请号:CN202010816539.X

    申请日:2020-08-14

    Inventor: 曾利彬 曹绍升

    Abstract: 本说明书一个或多个实施例提供了一种风险群组识别方法及装置,其中,该方法包括:获取待风控的目标业务的业务行为数据。基于该业务行为数据和至少一个目标介质类型,构建第一关系网络图谱;该第一关系网络图谱包括:用户节点、以及与目标介质类型对应的介质节点,该目标介质类型是基于利用训练好的图深度学习模型得到的边权重数据所确定的。利用预设群组划分方式,对第一关系网络图谱中的多个用户节点进行群组划分,得到多个目标群组。在多个目标群组中,根据各目标群组的业务行为数据,确定风险群组。

    针对业务模型进行数据预处理的方法及装置

    公开(公告)号:CN111523649A

    公开(公告)日:2020-08-11

    申请号:CN202010384217.2

    申请日:2020-05-09

    Inventor: 曹绍升 崔卿

    Abstract: 本发明涉及针对业务模型进行数据预处理的方法及装置。本说明书实施例提供一种新型的用于处理分类业务的业务模型,该业务模型通过多个深度网络实现,在多个深度网络中,通过引入描述不同特征值的特征表达向量,以及与各个分类类别分别对应的各个层标签向量,可以在每一个深度网络中,都充分考虑各个业务特征对于相应分类类别的重要度。在利用业务模型进行目标类别确定时,可以针对每个分类类别确定其作为待处理的业务数据的目标类别的可能性,从而提高业务模型的准确度,并且由于在各个深度网络中确定了相应业务特征的重要度系数,使得业务模型的业务处理结果具有可追溯性,提高使用体验。

    一种音乐小节的表示方法、装置及电子设备

    公开(公告)号:CN111477198A

    公开(公告)日:2020-07-31

    申请号:CN202010151122.6

    申请日:2020-03-05

    Inventor: 曹绍升 杨轶斐

    Abstract: 本说明书公开了一种音乐小节的表示方法、装置及电子设备,该方法包括:获取曲调库中包含有的音乐小节;为每个所述音乐小节建立表示向量;根据所述曲调库中的曲调,针对每个音乐小节获得所述音乐小节的上下文音乐小节,其中,所述上下文音乐小节为曲调中距离所述音乐小节预设距离以内的音乐小节;针对每个音乐小节,根据所述音乐小节的表示向量和所述上下文音乐小节的表示向量计算损失函数得分,并基于所述得分更新所述音乐小节的表示向量,使得音乐小节的表示向量与其上下文音乐小节的表示向量之间的相似度不断增大,音乐小节的表示向量与负样例向量之间的相似度不断减小,从而实现对每个音乐小节的语义向量化表示。

Patent Agency Ranking