基于动态信息学习的风险预测方法及装置

    公开(公告)号:CN119513698A

    公开(公告)日:2025-02-25

    申请号:CN202411665819.X

    申请日:2024-11-20

    Applicant: 复旦大学

    Abstract: 本发明提供了一种基于动态信息学习的风险预测方法及装置,具有这样的特征,包括以下步骤:步骤S1,对所有特征分别进行预处理,得到对应的预处理特征;步骤S2,根据所有预处理特征构建特征向量,并将特征向量输入预测模型,得到风险预测结果,其中,预测模型包括:中间变量计算模块,用于对特征向量进行线性变换,计算得到中间变量;信息贡献度量计算模块,用于对中间变量进行特征过滤,得到信息贡献度量;特征保留模块,用于根据信息贡献度量和特征向量,计算得到保留特征信息;分类模块,包括神经网络分类器,用于根据保留特征信息计算得到对应的风险预测标签作为风险预测结果。总之,本方法能够生成准确的风险预测结果。

    用于风险画像构建的多视野标签生成方法及装置

    公开(公告)号:CN119443821A

    公开(公告)日:2025-02-14

    申请号:CN202411696233.X

    申请日:2024-11-25

    Applicant: 复旦大学

    Abstract: 本发明提供了一种用于风险画像构建的多视野标签生成方法及装置,具有这样的特征,包括步骤S1‑S2,构建子特征集合并计算各个特征的重要性值和相关性值以及特征筛选量;步骤S3,构建筛选特征集合;步骤S4,计算并根据筛选特征集合中各个特征的相关性值,构建正相关特征集合和负相关特征集合;步骤S5,根据筛选特征集合中各个特征对应的唯一值的数量,构建离散特征集合和连续特征集合;步骤S6,根据正相关特征集合、负相关特征集合、离散特征集合和连续特征集合,得到多视野模型特征集合;步骤S7,计算多视野模型特征集合中各个目标对应的各个特征的woe值。总之,本方法能够生成具有更优风险表达能力的标签。

    基于自注意力机制的不平衡信贷违约预测方法及装置

    公开(公告)号:CN119273444A

    公开(公告)日:2025-01-07

    申请号:CN202310812519.9

    申请日:2023-07-04

    Applicant: 复旦大学

    Inventor: 吴杰 谭言丹

    Abstract: 本发明提供一种基于自注意力机制的不平衡信贷违约预测方法及装置,该方法包括数据预处理步骤、模型训练步骤以及信贷违约预测步骤,其中,对基于自注意力机制的深度神经网络模型进行训练并利用该模型进行信贷违约的预测,该模型利用先进的自注意力机制,能够有效地提炼出稀疏复杂的金融信贷数据中的关键信息,并通过学习这些关键信息中的内在模式,推导出鲁棒的预测机制。进一步,为了应对金融信贷数据的不平衡性,在模型训练步骤中引入了f1分数作为该模型的训练评价指标,以辅助模型训练,其目的在于找到最优的模型状态,以更准确地识别违约用户,从而实现对不平衡的金融信贷数据的有效学习,提高信贷违约预测的准确率。

    一种基于多门控混合专家网络的金融连续变量编码方法

    公开(公告)号:CN118485102A

    公开(公告)日:2024-08-13

    申请号:CN202310104854.3

    申请日:2023-02-13

    Applicant: 复旦大学

    Inventor: 吴杰 柴洪峰 肖凯

    Abstract: 本发明提供一种基于多门控混合专家网络的金融连续变量编码方法,在该方法中,混合专家网络通过使用多个专家网络为输入的连续数值分别学习多个编码向量表示,所有连续变量的数值共享这些专家网络,因此混合专家网络能够基于所有变量的全局信息来学习不同连续变量的共性和差异性。而门控模块能够为每类连续变量学习单独的偏好矩阵,表示对应专家网络的权重,通过加权求和得到输入数值最终的编码向量。门控模块基于每类变量的特点,即局部信息,实现了不同类变量使用不同的专家组合进行学习,在学习方式上更加灵活。因此,本发明能够与深度学习预测模型实现端到端优化,同时能够结合更多信息学习到变量之间更加复杂的关系,有效提升模型的预测效果。

    基于遗忘恢复学习的增强深度神经网络公平性方法及装置

    公开(公告)号:CN118396065A

    公开(公告)日:2024-07-26

    申请号:CN202410164522.9

    申请日:2024-02-05

    Applicant: 复旦大学

    Abstract: 本发明提供了一种基于遗忘恢复学习的增强深度神经网络公平性方法及装置,具有这样的特征,包括以下步骤:步骤S1将偏见训练集划分为多个子训练集;步骤S2计算预训练模型在各个子训练集上的识别准确率;步骤S3将最高的识别准确率对应的子训练集作为主导训练集;步骤S4根据主导训练集构建第一数据集;步骤S5将第一数据集中的各个样本的标签进行随机更改,得到偏差数据集;步骤S6根据偏差数据集对预训练模型进行训练,得到选择性遗忘模型;步骤S7从各个子训练集中选取多个样本构建平衡数据集;步骤S8根据平衡数据集对选择性遗忘模型进行训练,得到微调模型。总之,本方法能够提升公平性的同时保持模型预测准确率。

    一种自动特征编码的变分自编码表格数据合成方法

    公开(公告)号:CN118211137A

    公开(公告)日:2024-06-18

    申请号:CN202211622135.2

    申请日:2022-12-16

    Applicant: 复旦大学

    Inventor: 吴杰 刘森 谭言丹

    Abstract: 本发明提供一种自动特征编码的变分自编码表格数据合成方法,包括:对训练集中的连续特征采用IGPDF来确定基于VGM编码的聚类上限;构建ATVAE模型,该模型的编码器基于ELBO策略能够将编码后的训练数据的原始分布映射为正态分布,解码器将正态分布的噪声映射为训练数据的合成样本;编码后的训练数据输入至模型,并采用反向传播对输出的合成样本及分布优化;基于确定好的VGM编码的聚类上限,对待合成数据中的连续特征数据编码,对离散特征独时热编码;对于编码后的待合成数据,通过编码器学习到对应的分布,由解码器基于分布的噪声合成所需要的表格数据。本发明能有效辅助合成复杂连续特征的多种高斯分布,降低模型学习的复杂度,使数据分布合成更优。

    一种基于不平衡金融数据的条件变分自编码数据合成方法

    公开(公告)号:CN118210796A

    公开(公告)日:2024-06-18

    申请号:CN202211622155.X

    申请日:2022-12-16

    Applicant: 复旦大学

    Inventor: 吴杰 刘森 谭言丹

    Abstract: 本发明提供一种基于不平衡金融数据的条件变分自编码数据合成方法,包括:对离散特征和连续特征分别进行编码,并将二者的特征编码结果进行拼接生成编码后金融数据;构建CTVAE模型,该模型的编码器基于ELBO策略将编码后的金融数据的原始分布映射为正态分布,解码器将正态分布的噪声映射为合成数据;将编码后金融数据输入至模型,基于条件采样和条件优化训练模型,得到数据合成模型;对于特征编码后的不平衡金融数据,通过数据合成模型的编码器学习到对应的分布,由解码器基于分布的噪声合成所需要的金融数据。本发明在应对数据集中特征不平衡的情况和分布拟合方面,能够辅助不平衡离散值的合理合成,具有较优的性能和更高的适用性。

    一种协议无关的双拥塞控制方法

    公开(公告)号:CN108882302B

    公开(公告)日:2021-04-30

    申请号:CN201811062808.7

    申请日:2018-09-12

    Applicant: 复旦大学

    Abstract: 本发明属于网络技术领域,具体为一种协议无关的双拥塞控制方法。本发明方法包括:根据网络当前拥塞状态参数确定传统拥塞控制算法单独作用下的网络拥塞概率Qn(t);根据Qn(t)与Pn(mn)的反比关系确定基于波长变化的拥塞控制算法单独作用下的网络拥塞概率Pn(mn);Qn(t)和Pn(mn)共同控制网络的拥塞状态。本发明的优势在于:波长的可变性会降低网络的拥塞概率,并且在满足一定的条件下,可以不影响或者提升网络的整体吞吐率和带宽利用率;传统网络拥塞控制算法只需要做很少改进来适配Pn(mn),保证该方法的灵活性和可扩展性。利用本发明,可以优化传统拥塞控制算法,提升网络吞吐率和带宽利用率。

    一种基于区块链的分布式数据交易记账系统

    公开(公告)号:CN110717825A

    公开(公告)日:2020-01-21

    申请号:CN201810682292.X

    申请日:2018-06-27

    Applicant: 复旦大学

    Abstract: 本发明属于云计算资源管理领域,涉及分布式数据存储、点对点传输、共识机制技术,具体涉及一种基于区块链的分布式数据交易记账系统。本发明包括:使用前置机容器作为通信工具在各个物理机之间发送接收交易;使用开源的Hyperledger Fabric搭建联盟链;使用java编写Monitor将交易信息写入区块链;使用couchdb数据库进行富查询;使用开源工具fabric-explorer将区块生成信息可视化的展示出来。本发明解决了传统数据存储的过中心化、缺乏信任,数据在传输过程中可能被修改等问题,实现了一致、防篡改、自动化和高效的账单记录以及账本的保存、智能清算。

    基于OpenStack云进行Hadoop集群自动化伸缩部署及Plugin部署方法

    公开(公告)号:CN110647379A

    公开(公告)日:2020-01-03

    申请号:CN201810682329.9

    申请日:2018-06-27

    Applicant: 复旦大学

    Inventor: 吕智慧 吴杰 强浩

    Abstract: 本发明属于云计算技术领域,具体涉及一种基于OpenStack云进行Hadoop集群自动化伸缩部署及Plugin部署的方法。本发明方法包括:在Hadoop集群部署阶段,基于资源使用率的集群自动伸缩策略以及基于任务成功率的置换机制。本发明使得OpenStack对集群提供更好的支持,集群规模能够根据不同时段的业务处理量进行调整,保障业务处理的速度。

Patent Agency Ranking