一种模型训练的方法、业务风控的方法及装置

    公开(公告)号:CN116308738A

    公开(公告)日:2023-06-23

    申请号:CN202310140918.5

    申请日:2023-02-10

    Inventor: 郭鑫泠 许浩 杨耀

    Abstract: 本说明书公开了一种模型训练的方法、业务风控的方法及装置。首先,确定预先构建的业务关系图。其次,获取各用户的目标属性数据以及各用户之间所产生的业务行为的目标业务信息。而后,将业务关系图、各用户的目标属性数据以及各用户之间所产生的业务行为的目标业务信息输入到待训练的风控模型中,预测各用户所属的用户群体以及各用户所属用户群体的风险标签。最后,以最小化各用户所属的用户群体与各用户所属的实际用户群体之间的偏差,以及最小化各用户所属用户群体的风险标签与各用户所属用户群体的实际风险标签之间的偏差为优化目标,对风控模型进行训练。本方法可以提高风控模型确定出的风控结果的准确性。

    一种面向结构化数据的预处理和补全方法

    公开(公告)号:CN115145906B

    公开(公告)日:2023-01-03

    申请号:CN202211068167.2

    申请日:2022-09-02

    Abstract: 本发明公开一种面向结构化数据的预处理和补全方法,包括:步骤一,对原始数据的缺失信息进行查询,统计缺失值,得到原始数据的缺失率;步骤二,根据缺失率对原始数据进行行列剔除处理,然后进行行遍历生成行对应数组,再将数组转换为直方图形式,计算出对应直方图构成的最大的矩形面积,接着对所有矩形面积进行排序,采集得到最大的完整信息矩阵;步骤三,采用基于链式方程进行的多重填补方法或基于编码器的多重填补方法或基于对抗生成网络的填补方法,对原始数据进行缺失值填补。本发明能够对原始数据进行缺失信息统计,自动搜寻满足条件的最大完整信息,补全结构化数据,极大提高原始数据集的质量,对后期的预测任务提供了便利。

    一种金融隐私数据混淆方法、装置、设备和可读存储介质

    公开(公告)号:CN118228309A

    公开(公告)日:2024-06-21

    申请号:CN202410372141.X

    申请日:2024-03-29

    Abstract: 本申请涉及一种金融隐私数据混淆方法、装置、设备和可读存储介质,其中,金融隐私数据混淆方法包括:通过根据业务要求获取业务原始数据表;识别所述原始业务数据表中需要进行数据混淆的隐私数据列;根据各所述隐私数据列的数据区间范围,设置对应的数据失真噪声因子;基于各所述数据失真噪声因子,对各对应的隐私数据列中的数据添加噪声,得到数据混淆后的业务数据表,解决了金融隐私数据被泄露的问题,可以在最大程度不影响智能算法应用的前提下,安全地保护金融隐私数据不被泄露。

    图数据分类方法、装置、电子装置和存储介质

    公开(公告)号:CN117235584B

    公开(公告)日:2024-04-02

    申请号:CN202311522727.1

    申请日:2023-11-15

    Abstract: 本申请涉及一种图数据分类方法、装置、电子装置和存储介质,其中,该图数据分类方法包括:获取图数据训练集;对目标待训练图数据中的邻接矩阵进行降维处理,得到降维目标邻接矩阵;基于目标待训练图数据的节点属性特征以及降维目标邻接矩阵对待训练图神经网络模型进行训练,得到训练好的图神经网络模型;基于训练好的图神经网络模型对待分类图数据进行分类,得到待分类图数据的分类结果。通过本申请,解决了现有图神经网络模型对社交网络图数据的分类结果的准确度较低的问题,提高了图神经网络模型的鲁棒性,进而提高了图神经网络模型对社交网络图数据的分类结果的稳定性和鲁棒性。

    基于车险场景的风险识别方法和装置

    公开(公告)号:CN117273963A

    公开(公告)日:2023-12-22

    申请号:CN202311550781.7

    申请日:2023-11-21

    Abstract: 本申请涉及一种基于车险场景的风险识别方法和装置。所述方法包括:对获取到的车险场景预测数据集进行预处理,得到待预测特征;将所述待预测特征输入人工智能模型进行风险预测,得到是否为风险案件的结论;将被预测为所述风险案件的所述待预测特征送入可解释性模型进行分析,得到所述风险案件的建议检查点。采用本方法能够解决人工手段识别车险场景的风险效率低,准确性差的问题,实现对车险场景下风险案件的快速预测和对疑点的准确迅速定位。

    图数据分类方法、装置、电子装置和存储介质

    公开(公告)号:CN117235584A

    公开(公告)日:2023-12-15

    申请号:CN202311522727.1

    申请日:2023-11-15

    Abstract: 本申请涉及一种图数据分类方法、装置、电子装置和存储介质,其中,该图数据分类方法包括:获取图数据训练集;对目标待训练图数据中的邻接矩阵进行降维处理,得到降维目标邻接矩阵;基于目标待训练图数据的节点属性特征以及降维目标邻接矩阵对待训练图神经网络模型进行训练,得到训练好的图神经网络模型;基于训练好的图神经网络模型对待分类图数据进行分类,得到待分类图数据的分类结果。通过本申请,解决了现有图神经网络模型对社交网络图数据的分类结果的准确度较低的问题,提高了图神经网络模型的鲁棒性,进而提高了图神经网络模型对社交网络图数据的分类结果的稳定性和鲁棒性。

    一种基于知识迁移和自监督学习的纵向联邦金融风控方法

    公开(公告)号:CN117853212B

    公开(公告)日:2024-06-18

    申请号:CN202410255763.4

    申请日:2024-03-06

    Abstract: 本发明公开了一种基于知识迁移和自监督学习的纵向联邦金融风控方法及装置,所述方法首先分别在金融机构和各互联网电商各自本地数据集上进行预训练,其中对有标签的金融机构,进行有监督学习,得到本地预训练模型表示层和推理层,对无标签的互联网电商,进行自监督学习,得到本地预训练模型表示层;然后在重叠数据集上建立纵向联邦风控模型,并利用预训练阶段的本地预训练模型,辅助纵向联邦模型训练,提升纵向联邦模型性能。本发明通过纵向联邦学习,在保护各方数据安全和数据隐私的前提下,实现了用户特征维度的扩展;通过知识迁移和自监督学习,实现了非重叠数据的利用,大大提高了纵向联邦金融风控模型的预测准确度。

    基于车险场景的风险识别方法和装置

    公开(公告)号:CN117273963B

    公开(公告)日:2024-06-07

    申请号:CN202311550781.7

    申请日:2023-11-21

    Abstract: 本申请涉及一种基于车险场景的风险识别方法和装置。所述方法包括:对获取到的车险场景预测数据集进行预处理,得到待预测特征;将所述待预测特征输入人工智能模型进行风险预测,得到是否为风险案件的结论;将被预测为所述风险案件的所述待预测特征送入可解释性模型进行分析,得到所述风险案件的建议检查点。采用本方法能够解决人工手段识别车险场景的风险效率低,准确性差的问题,实现对车险场景下风险案件的快速预测和对疑点的准确迅速定位。

Patent Agency Ranking