基于平衡分数表征的异质连续因果效应估计方法及系统

    公开(公告)号:CN116757079A

    公开(公告)日:2023-09-15

    申请号:CN202310722219.1

    申请日:2023-06-16

    Applicant: 浙江大学

    Abstract: 本发明公开了一种基于平衡分数表征的异质连续因果效应估计方法及系统,属于数据挖掘领域。步骤如下:1)将高维市场营销数据按照商品属性信息、商品促销策略和用户购买意向划分为协变量、连续处理及结果;2)通过一个条件独立约束器,在对多维连续商品促销策略和高维商品属性分别进行信息抽取的同时,对多维连续商品促销策略和高维商品属性的表征进行一次基于对比学习的条件关联约束,以得到商品促销策略和商品属性在其上条件独立的平衡分数表征;3)利用一个反事实编码器,用平衡分数表征来生成不同多维连续商品促销策略值的反事实用户购买意向。本发明有效地保留了高维市场营销数据中混淆变量的信息,保证了用户购买意向的无偏因果效应估计。

    一种基于生成对抗网络的图像数据隐私保护方法

    公开(公告)号:CN115292728B

    公开(公告)日:2023-08-04

    申请号:CN202210837537.8

    申请日:2022-07-15

    Applicant: 浙江大学

    Abstract: 本发明公开了一种基于生成对抗网络的图像数据隐私保护方法,所述方法包括:获取待保护图片及对应的可训练标签,得到图片训练集,并利用该数据集训练一个基于深度神经网络的图片分类模型;利用训练好的图片分类模型和图片训练集在生成对抗网络的框架下训练生成器模型和判别器模型,其中生成器模型为每个待保护图片生成加密噪声,判别器模型保证噪声是微小且不易察觉的;生成对抗网络训练完成后,将待保护的图片输入至生成器模型得到微小的噪声,将该噪声添加到原图上即可获得加密后的图片。本发明通过对图片数据添加微小噪声将其变为不可学习图片数据,任何基于深度神经网络的模型无法从这些数据中学习到有用的知识,从而保护加密图片的数据隐私。

    基于潜在群组工具变量的多方混合数据溯源方法及系统

    公开(公告)号:CN115188484A

    公开(公告)日:2022-10-14

    申请号:CN202210836782.7

    申请日:2022-07-15

    Inventor: 况琨 吴安鹏 吴飞

    Abstract: 本发明公开了一种基于潜在群组工具变量的多方混合数据溯源方法及系统。该方法通过表征学习,将病况信息映射到一个表征空间;再通过期望最大化算法,基于给定的类簇数量,利用期望最大化算法识别异质治疗方案分配机制,即干预变量和混淆变量在不同数据来源上有不同的因果关系;最后基于异质治疗方案分配机制,将病历数据划分为多个不同的样本子群,并且基于相关性指标为数据选择最佳群组工具变量作为多方数据的不同来源指示变量,以此溯源得到不同医疗机构诊疗手段的差异,实现病历样本的分组。本发明可进一步基于来源指示变量,将潜在群组工具变量嵌入工具变量回归方法结合多方知识进行联合学习,为每一位病人提供辅助的精准治疗方案推荐。

    因果去偏差模型指导的法院观点自动生成方法

    公开(公告)号:CN112307726A

    公开(公告)日:2021-02-02

    申请号:CN202011238302.4

    申请日:2020-11-09

    Applicant: 浙江大学

    Abstract: 本发明公开了一种因果去偏差模型指导的法院观点自动生成方法,属于自然语言生成领域。包括如下步骤:1)根据关键字,将裁判文书按照原告诉请、事实描述以及法院观点进行分割,并对法院观点中的判决结果进行支持与否的标注,以得到训练数据集;2)通过一个诉请感知编码器,先对原告诉请和事实描述分别进行信息抽取,再对事实描述进行一次基于原告诉请的注意力计算,以得到感知了诉请的事实的向量化特征表示;3)利用一对反事实解码器来生成不同判决下的法院观点;4)通过连接一个判决预测器来选择最终的“法院观点”。相比一般的文本生成算法,本发明充分考虑了真实场景中判决结果分布不均匀这一客观事实,并有效地消除了潜在的偏向性。

    一种目标变量预测模型的生成方法、系统及装置

    公开(公告)号:CN112101516A

    公开(公告)日:2020-12-18

    申请号:CN202010750071.9

    申请日:2020-07-30

    Inventor: 付维麟 况琨 郭健

    Abstract: 本发明提出了一种目标变量预测模型的生成方法、系统及装置,通过获取原始数据集;将原始数据集中含有的自变量数据和所述自变量数据随机生成的自变量随机矩阵输入至预设对抗网络模型,利用所述预设对抗网络模型,得到权重向量;利用所述原始数据集和利用权重向量对待训练的预设神经网络模型进行训练和模型参数调整,直至得到训练完成的目标变量预测模型。本发明实施例利用预设对抗网络模型根据原始数据集生成权重向量,并使用权重向量对预设网络模型的损失函数进行训练得到目标变量预测模型,而目标变量预测模型即使在训练数据集的数据分布发生了非常大变化的情况下,依然可以保持较好的预测能力。

    多图多模态大语言模型中的语义对齐方法及系统

    公开(公告)号:CN119027945A

    公开(公告)日:2024-11-26

    申请号:CN202410956798.0

    申请日:2024-07-17

    Abstract: 本发明公开了一种多图多模态大语言模型中的语义对齐方法及系统,具体过程为:从现有的单图数据集中搜集组片组,并利用图像分割、图像填充技术和大语言模型来构建多图多模态样本,并将其用于语义对齐增强的多图多模态大模型训练中。其中,模型首先通过视觉编码器对输入图片进行编码,生成视觉编码图,并通过Q‑former模块抽取视觉标记。在此基础上,通过自适应权重调整模块生成上下文语义特征,并将其与当前感知图片的语义引导特征结合,最终生成具有增强语义对齐的视觉标记。本发明显著提升了多图任务中的语义对齐能力,特别是在处理图片差异较大的场景下,达到了较高的性能提升;同时也能确保在图片高度相似的情况下保留一定的语义对齐能力。

    针对视觉语言模型的对抗性知识蒸馏方法、系统及设备

    公开(公告)号:CN118334463A

    公开(公告)日:2024-07-12

    申请号:CN202410421826.9

    申请日:2024-04-09

    Applicant: 浙江大学

    Inventor: 况琨 杨津滦 吴飞

    Abstract: 本发明公开了一种针对视觉语言模型的对抗性知识蒸馏方法,包括:获取训练样本并对教师视觉语言模型进行微调,在预热阶段优化学生视觉语言模型的初始参数,在蒸馏过程中交替优化对抗样本生成器和学生视觉语言模型,最后将待检测的图像或者文本输入到优化后的学生视觉语言模型中,得到对应的检测结果。本发明通过设计对抗样本生成‑知识蒸馏匹配的交互式框架,统一了视觉模态与语言模态的对抗样本生成过程,可以产生促使教师视觉语言模型与学生视觉语言模型输出匹配的高质量对抗样本,从而提高学生视觉语言模型的性能与泛化能力。

Patent Agency Ranking