-
公开(公告)号:CN116797895A
公开(公告)日:2023-09-22
申请号:CN202310726033.3
申请日:2023-06-16
Applicant: 浙江大学
Abstract: 本发明公开了一种面向司法场景的多模态融合身份鉴别方法、介质及设备,属于身份识别领域。本发明能够通过对多种表征人体身份的人脸、虹膜及指纹等模态数据进行特征提取,并融入面部微表情、皱纹及关键点信息,确保不会因为面部纹理变化带来的误识别问题,最终借助自注意力机制对多模态特征及面部微特征进行联合学习,得到最终的识别结果。该方法能够应用在智慧司法的立案、庭审及诉服等司法身份鉴别场景中,实现优异地身份鉴别能力。
-
公开(公告)号:CN116777523A
公开(公告)日:2023-09-19
申请号:CN202310729122.3
申请日:2023-06-16
Applicant: 浙江大学
IPC: G06Q30/0241 , G06F18/214 , G06N5/04 , G06N3/04 , G06N3/08
Abstract: 本发明公开了一种面向广告增效建模场景的去偏差因果推断方法及其系统。本发明包括如下步骤:1)首先基于当期广告增效日志记录对店铺、消费者特征数据进行划分并构建数据集;2)构建深度神经网络模型,对店铺和消费者特征进行信息抽取,再通过一个积分概率度量模块对抽取信息的分布相似度进行限制,以得到平衡的特征表示;3)构建基于深度神经网络的投放后成交额预测模型和屏蔽后结果预测网络模型,并基于平衡后的特征表示进行训练;4)基于训练后的去偏模型广告投放后成交额和广告屏蔽后成交额进行预测,估计广告增效。本发明实现了对广告增效的准确建模,能够面向线上购物平台进行广告增效目标用户筛选。
-
公开(公告)号:CN116258375A
公开(公告)日:2023-06-13
申请号:CN202211536711.1
申请日:2022-12-01
Applicant: 浙江大学
IPC: G06Q10/0637 , G06Q50/18
Abstract: 本发明提供了一种基于论据生成的刑事案件判决预测方法、介质及设备。该方法包括:S1:构建包含事实描述、定罪论据、量刑论据、判决结果(包含法条、罪名、刑期)的训练样本数据集;S2:通过训练得到从事实描述中生成定罪论据和量刑论据的论据生成模块作为整个框架的第一部分;S3:利用层次化序列模型提取事实描述和生成的论据中的特征,并根据预测任务之间逻辑上的拓扑关系进行对应的案件信息加权聚合;S4:利用聚合后的信息,对对应的任务进行预测。相比一般判决预测方法,本发明创新性地对真实裁判场景进行了建模,加入了论据生成模块,提升了预测效果的同时,保证了模型的可交互性与可解释性。
-
公开(公告)号:CN115292728A
公开(公告)日:2022-11-04
申请号:CN202210837537.8
申请日:2022-07-15
Applicant: 浙江大学
IPC: G06F21/60 , G06V10/774 , G06V10/764 , G06V10/82 , G06N3/04 , G06N3/08
Abstract: 本发明公开了一种基于生成对抗网络的图像数据隐私保护方法,所述方法包括:获取待保护图片及对应的可训练标签,得到图片训练集,并利用该数据集训练一个基于深度神经网络的图片分类模型;利用训练好的图片分类模型和图片训练集在生成对抗网络的框架下训练生成器模型和判别器模型,其中生成器模型为每个待保护图片生成加密噪声,判别器模型保证噪声是微小且不易察觉的;生成对抗网络训练完成后,将待保护的图片输入至生成器模型得到微小的噪声,将该噪声添加到原图上即可获得加密后的图片。本发明通过对图片数据添加微小噪声将其变为不可学习图片数据,任何基于深度神经网络的模型无法从这些数据中学习到有用的知识,从而保护加密图片的数据隐私。
-
公开(公告)号:CN112347780A
公开(公告)日:2021-02-09
申请号:CN202011357568.0
申请日:2020-11-27
Applicant: 浙江大学
IPC: G06F40/289 , G06K9/62 , G06N3/04 , G06N3/08 , G06Q50/18
Abstract: 本发明公开了一种基于深度神经网络的司法事实查明生成方法、装置、介质。本发明针对对话形式的庭审笔录文本数据,利用层次化序列模型提取其特征,获得词级别,句级别和对话级别的向量化表征;然后将事实要素分类任务和缺失事实查明任务作为辅助任务,在多任务学习框架下构建符合司法程序逻辑的事实查明场景;最后将特征提取结果链接组合,在多任务学习框架下利用基于注意力机制的Seq2Seq模型,生成符合庭审记录的司法事实查明结果。本发明将深度序列学习模型应用于司法事实查明自动生成,相比一般文本生成算法,本发明对法律文书中事实性关键信息进行建模,辅助文本生成,有效地保留了原文中事实性要素,保证了生成模型的可控性与可解释性。
-
公开(公告)号:CN119204218A
公开(公告)日:2024-12-27
申请号:CN202411269745.8
申请日:2024-09-11
Applicant: 浙江大学 , 马上消费金融股份有限公司
Abstract: 本发明公开了一种面向混杂和对撞复杂偏差的因果推断方法及系统,本发明的方法包括如下步骤:获取人群特征与行为数据并进行标记;联合训练解耦表征生成器和处理变量估计器,各自训练解耦表征生成器、处理变量估计器、R1估计器、R0估计器以及第一结果变量估计器,然后训练第二结果变量估计器;最终将想要进行因果效应估计的人群特征与行为数据输入到因果效应估计模型中,预测施加干预对比不施加干预带来的人群行为变化。相较于只能去除混淆偏差的传统的工具变量回归方法,本发明充分考虑了现实复杂场景中可能同时存在选择偏差和混淆偏差,并实现了在复杂偏差场景下的因果效应无偏估计。
-
公开(公告)号:CN118861264A
公开(公告)日:2024-10-29
申请号:CN202410836011.7
申请日:2024-06-26
Applicant: 浙江大学
IPC: G06F16/335 , G06F40/30 , G06F40/211 , G06F40/258 , G06Q50/18
Abstract: 本发明公开了一种类案检索增强的诉请生成和评测方法、系统、介质及设备,所述方法包括:1)构建民事判决书语料库,经过预处理和筛选保留与任务相关的段落,形成包含多样化案由的原告事实‑原告诉请片段对;2)通过BM25检索模型根据待生成诉请的原告事实检索出类似案件作为参考案例;3)根据待生成诉请的原告事实和检索到的类似案件事实由大型语言模型生成案件诉请;4)通过大型语言模型的评估能力,从事实性、清晰性和一致性三个方面对生成的诉请进行评测,并辅以人工评估。本发明将类案检索增强的方法应用于诉请生成,可以根据场景中的事实生成诉请,并对诉请质量进行评估,从而辅助非专业人员得到法律支持,促进法律支持的可及性。
-
公开(公告)号:CN118446308A
公开(公告)日:2024-08-06
申请号:CN202410421823.5
申请日:2024-04-09
Applicant: 上海浙江大学高等研究院
Abstract: 本发明公开了一种面向选择偏差的影子变量表征生成与因果推断方法及系统,包括如下步骤:影子变量表征生成,将观察到的协变量映射到表征空间,并施加影子变量所需要的约束,同时对生成的影子变量表征进行假设检验,最终生成符合影子变量假设的表征;将生成的通过了假设检验的影子变量表征嵌入影子变量回归方法准确预测因果效应。本发明使用两阶段的方法,第一阶段在表征生成过程中施加影子变量约束,第二阶段对生成的影子变量表征进行检验,以迭代的方式自动学习得到影子变量表征。相较于传统的影子变量回归方法,本发明放宽了对专家知识进行影子变量挑选的依赖;对于影子变量挑选方法来说,本发明也不再依赖观测数据中必须存在影子变量。
-
公开(公告)号:CN116994026A
公开(公告)日:2023-11-03
申请号:CN202310684440.2
申请日:2023-06-09
Applicant: 浙江大学
IPC: G06V10/764 , G06V10/774
Abstract: 本发明提供了一种基于对比学习与不变因果性的可泛化图像分类方法及装置。该方法包括:从多个环境中采集不同的图像构建多个源域用于训练;构建全局特征队列来存储先前提取过的特征,利用对比学习来学习输入样本和对应正样本之间的相似度;使用对比相似度来量化图像特征之间的因果关系;训练分类器根据该特征预测标签,并选取下一个不同的源域抽取样本进行训练;完成训练后直接将待预测样本输入特征提取器提取特征,并利用该特征直接预测标签。本发明可以使用多个不同源域的数据进行训练得到符合因果关系且可泛化的模型参数,对分布与训练数据有显著差异的目标数据上有稳定且出色的预测结果,解决训练数据有限且目标数据与训练数据分布有显著差别的情况。
-
公开(公告)号:CN116883545A
公开(公告)日:2023-10-13
申请号:CN202310827912.5
申请日:2023-07-06
Applicant: 浙江大学
IPC: G06T11/60 , G06V10/764 , G06V10/82 , G06N3/0895 , G06N3/084
Abstract: 本发明提供了一种基于扩散模型的图片数据集扩充方法、介质及设备。该方法包括:S1:针对原始图片数据集中的图像,设计对应的文本描述;S2:构建单词‑图像重映射模块嵌入预训练过的扩散模型,使用原始图片和对应文本描述作为输入数据对,训练单词‑图像重映射模块,构建图片到单词的重新映射;S3:固定扩散模型与其中的单词‑图像重映射模块,通过文本描述中单词的重新组合和拼接,构建新的文本描述。通过使用该文本描述与不同的随机噪声,通过扩散模型生成不同于数据集的图片,从而完成对原始图片数据集的扩充。
-
-
-
-
-
-
-
-
-