面向广告增效建模场景的去偏差因果推断方法及其系统

    公开(公告)号:CN116777523A

    公开(公告)日:2023-09-19

    申请号:CN202310729122.3

    申请日:2023-06-16

    Applicant: 浙江大学

    Inventor: 况琨 李保宏 吴飞

    Abstract: 本发明公开了一种面向广告增效建模场景的去偏差因果推断方法及其系统。本发明包括如下步骤:1)首先基于当期广告增效日志记录对店铺、消费者特征数据进行划分并构建数据集;2)构建深度神经网络模型,对店铺和消费者特征进行信息抽取,再通过一个积分概率度量模块对抽取信息的分布相似度进行限制,以得到平衡的特征表示;3)构建基于深度神经网络的投放后成交额预测模型和屏蔽后结果预测网络模型,并基于平衡后的特征表示进行训练;4)基于训练后的去偏模型广告投放后成交额和广告屏蔽后成交额进行预测,估计广告增效。本发明实现了对广告增效的准确建模,能够面向线上购物平台进行广告增效目标用户筛选。

    基于论据生成的刑事案件判决预测方法、介质及设备

    公开(公告)号:CN116258375A

    公开(公告)日:2023-06-13

    申请号:CN202211536711.1

    申请日:2022-12-01

    Applicant: 浙江大学

    Abstract: 本发明提供了一种基于论据生成的刑事案件判决预测方法、介质及设备。该方法包括:S1:构建包含事实描述、定罪论据、量刑论据、判决结果(包含法条、罪名、刑期)的训练样本数据集;S2:通过训练得到从事实描述中生成定罪论据和量刑论据的论据生成模块作为整个框架的第一部分;S3:利用层次化序列模型提取事实描述和生成的论据中的特征,并根据预测任务之间逻辑上的拓扑关系进行对应的案件信息加权聚合;S4:利用聚合后的信息,对对应的任务进行预测。相比一般判决预测方法,本发明创新性地对真实裁判场景进行了建模,加入了论据生成模块,提升了预测效果的同时,保证了模型的可交互性与可解释性。

    一种基于生成对抗网络的图像数据隐私保护方法

    公开(公告)号:CN115292728A

    公开(公告)日:2022-11-04

    申请号:CN202210837537.8

    申请日:2022-07-15

    Applicant: 浙江大学

    Abstract: 本发明公开了一种基于生成对抗网络的图像数据隐私保护方法,所述方法包括:获取待保护图片及对应的可训练标签,得到图片训练集,并利用该数据集训练一个基于深度神经网络的图片分类模型;利用训练好的图片分类模型和图片训练集在生成对抗网络的框架下训练生成器模型和判别器模型,其中生成器模型为每个待保护图片生成加密噪声,判别器模型保证噪声是微小且不易察觉的;生成对抗网络训练完成后,将待保护的图片输入至生成器模型得到微小的噪声,将该噪声添加到原图上即可获得加密后的图片。本发明通过对图片数据添加微小噪声将其变为不可学习图片数据,任何基于深度神经网络的模型无法从这些数据中学习到有用的知识,从而保护加密图片的数据隐私。

    基于深度神经网络的司法事实查明生成方法、装置、介质

    公开(公告)号:CN112347780A

    公开(公告)日:2021-02-09

    申请号:CN202011357568.0

    申请日:2020-11-27

    Applicant: 浙江大学

    Abstract: 本发明公开了一种基于深度神经网络的司法事实查明生成方法、装置、介质。本发明针对对话形式的庭审笔录文本数据,利用层次化序列模型提取其特征,获得词级别,句级别和对话级别的向量化表征;然后将事实要素分类任务和缺失事实查明任务作为辅助任务,在多任务学习框架下构建符合司法程序逻辑的事实查明场景;最后将特征提取结果链接组合,在多任务学习框架下利用基于注意力机制的Seq2Seq模型,生成符合庭审记录的司法事实查明结果。本发明将深度序列学习模型应用于司法事实查明自动生成,相比一般文本生成算法,本发明对法律文书中事实性关键信息进行建模,辅助文本生成,有效地保留了原文中事实性要素,保证了生成模型的可控性与可解释性。

    面向混杂和对撞复杂偏差的因果推断方法及系统

    公开(公告)号:CN119204218A

    公开(公告)日:2024-12-27

    申请号:CN202411269745.8

    申请日:2024-09-11

    Abstract: 本发明公开了一种面向混杂和对撞复杂偏差的因果推断方法及系统,本发明的方法包括如下步骤:获取人群特征与行为数据并进行标记;联合训练解耦表征生成器和处理变量估计器,各自训练解耦表征生成器、处理变量估计器、R1估计器、R0估计器以及第一结果变量估计器,然后训练第二结果变量估计器;最终将想要进行因果效应估计的人群特征与行为数据输入到因果效应估计模型中,预测施加干预对比不施加干预带来的人群行为变化。相较于只能去除混淆偏差的传统的工具变量回归方法,本发明充分考虑了现实复杂场景中可能同时存在选择偏差和混淆偏差,并实现了在复杂偏差场景下的因果效应无偏估计。

    类案检索增强的诉请生成和评测方法、系统、介质及设备

    公开(公告)号:CN118861264A

    公开(公告)日:2024-10-29

    申请号:CN202410836011.7

    申请日:2024-06-26

    Applicant: 浙江大学

    Abstract: 本发明公开了一种类案检索增强的诉请生成和评测方法、系统、介质及设备,所述方法包括:1)构建民事判决书语料库,经过预处理和筛选保留与任务相关的段落,形成包含多样化案由的原告事实‑原告诉请片段对;2)通过BM25检索模型根据待生成诉请的原告事实检索出类似案件作为参考案例;3)根据待生成诉请的原告事实和检索到的类似案件事实由大型语言模型生成案件诉请;4)通过大型语言模型的评估能力,从事实性、清晰性和一致性三个方面对生成的诉请进行评测,并辅以人工评估。本发明将类案检索增强的方法应用于诉请生成,可以根据场景中的事实生成诉请,并对诉请质量进行评估,从而辅助非专业人员得到法律支持,促进法律支持的可及性。

    面向选择偏差的影子变量表征生成与因果推断方法及系统

    公开(公告)号:CN118446308A

    公开(公告)日:2024-08-06

    申请号:CN202410421823.5

    申请日:2024-04-09

    Abstract: 本发明公开了一种面向选择偏差的影子变量表征生成与因果推断方法及系统,包括如下步骤:影子变量表征生成,将观察到的协变量映射到表征空间,并施加影子变量所需要的约束,同时对生成的影子变量表征进行假设检验,最终生成符合影子变量假设的表征;将生成的通过了假设检验的影子变量表征嵌入影子变量回归方法准确预测因果效应。本发明使用两阶段的方法,第一阶段在表征生成过程中施加影子变量约束,第二阶段对生成的影子变量表征进行检验,以迭代的方式自动学习得到影子变量表征。相较于传统的影子变量回归方法,本发明放宽了对专家知识进行影子变量挑选的依赖;对于影子变量挑选方法来说,本发明也不再依赖观测数据中必须存在影子变量。

    基于对比学习与不变因果性的可泛化图像分类方法及装置

    公开(公告)号:CN116994026A

    公开(公告)日:2023-11-03

    申请号:CN202310684440.2

    申请日:2023-06-09

    Applicant: 浙江大学

    Abstract: 本发明提供了一种基于对比学习与不变因果性的可泛化图像分类方法及装置。该方法包括:从多个环境中采集不同的图像构建多个源域用于训练;构建全局特征队列来存储先前提取过的特征,利用对比学习来学习输入样本和对应正样本之间的相似度;使用对比相似度来量化图像特征之间的因果关系;训练分类器根据该特征预测标签,并选取下一个不同的源域抽取样本进行训练;完成训练后直接将待预测样本输入特征提取器提取特征,并利用该特征直接预测标签。本发明可以使用多个不同源域的数据进行训练得到符合因果关系且可泛化的模型参数,对分布与训练数据有显著差异的目标数据上有稳定且出色的预测结果,解决训练数据有限且目标数据与训练数据分布有显著差别的情况。

    基于扩散模型的图片数据集扩充方法、介质及设备

    公开(公告)号:CN116883545A

    公开(公告)日:2023-10-13

    申请号:CN202310827912.5

    申请日:2023-07-06

    Applicant: 浙江大学

    Abstract: 本发明提供了一种基于扩散模型的图片数据集扩充方法、介质及设备。该方法包括:S1:针对原始图片数据集中的图像,设计对应的文本描述;S2:构建单词‑图像重映射模块嵌入预训练过的扩散模型,使用原始图片和对应文本描述作为输入数据对,训练单词‑图像重映射模块,构建图片到单词的重新映射;S3:固定扩散模型与其中的单词‑图像重映射模块,通过文本描述中单词的重新组合和拼接,构建新的文本描述。通过使用该文本描述与不同的随机噪声,通过扩散模型生成不同于数据集的图片,从而完成对原始图片数据集的扩充。

Patent Agency Ranking