-
公开(公告)号:CN112347780B
公开(公告)日:2023-09-12
申请号:CN202011357568.0
申请日:2020-11-27
Applicant: 浙江大学
IPC: G06F40/289 , G06F18/214 , G06F18/213 , G06N3/0464 , G06N3/047 , G06N3/049 , G06N3/08 , G06Q50/18
Abstract: 本发明公开了一种基于深度神经网络的司法事实查明生成方法、装置、介质。本发明针对对话形式的庭审笔录文本数据,利用层次化序列模型提取其特征,获得词级别,句级别和对话级别的向量化表征;然后将事实要素分类任务和缺失事实查明任务作为辅助任务,在多任务学习框架下构建符合司法程序逻辑的事实查明场景;最后将特征提取结果链接组合,在多任务学习框架下利用基于注意力机制的Seq2Seq模型,生成符合庭审记录的司法事实查明结果。本发明将深度序列学习模型应用于司法事实查明自动生成,相比一般文本生成算法,本发明对法律文书中事实性关键信息进行建模,辅助文本生成,有效地保留了原文中事实性要素,保证了生成模型的可控性与可解释性。
-
公开(公告)号:CN112417155B
公开(公告)日:2022-06-10
申请号:CN202011357566.1
申请日:2020-11-27
Applicant: 浙江大学
IPC: G06F16/35 , G06F40/216 , G06K9/62 , G06N3/04 , G06Q50/18
Abstract: 本发明提供了一种基于指针‑生成Seq2Seq模型的庭审询问生成方法、装置、介质。该方法包括:S1:构建庭审质询文本生成框架中辅助特征提取模块的训练样本;S2:通过训练得到从句子映射到分类标签的字符级卷积神经网络模型作为第一模型;S3:使用S2中训练的第一模型对训练生成框架的输出文本进行逐句分类和信息精简;S4:基于指针‑生成器网络架构,构建并训练结合文本序列和标签特征的端到端Seq2Seq文本生成模型作为第二模型;S5:基于第一模型和第二模型,对输入文本进行端到端的庭审质询性问题自动生成。本发明可基于不同案件的起诉与答辩文本乃至部分庭审对话记录,结合由专家提供的类案判案逻辑,生成可供参考的庭审法官质询性问题,从而辅助法官判案。
-
公开(公告)号:CN112633503A
公开(公告)日:2021-04-09
申请号:CN202011493947.2
申请日:2020-12-16
Applicant: 浙江大学
Abstract: 本发明公开了一种基于神经网络的工具变量生成与反事实推理方法及装置。针对之前的基于工具变量的反事实推理(如手写数字识别)方法需要预先定义和可获取的工具变量的问题,本发明直接从可观测变量中学习和解耦出工具变量,大大提升了因果推断效率,节省了时间和成本。本发明首次自动地从可观测变量中提取出工具变量,在算法和运用上有独创性和独特性。将本发明应用于现有的基于工具变量的反事实预测方法,与使用真实工具变量的方法相比性能因果推断有明显提升。本发明着重于从可观测变量中解耦出工具变量的表征,解决了基于工具变量的反事实预测技术需要预先使用先验知识和高昂成本获取工具变量数据的难题,提升了手写数字识别等领域精度。
-
公开(公告)号:CN112417155A
公开(公告)日:2021-02-26
申请号:CN202011357566.1
申请日:2020-11-27
Applicant: 浙江大学
IPC: G06F16/35 , G06F40/216 , G06K9/62 , G06N3/04 , G06Q50/18
Abstract: 本发明提供了一种基于指针‑生成Seq2Seq模型的庭审询问生成方法、装置、介质。该方法包括:S1:构建庭审质询文本生成框架中辅助特征提取模块的训练样本;S2:通过训练得到从句子映射到分类标签的字符级卷积神经网络模型作为第一模型;S3:使用S2中训练的第一模型对训练生成框架的输出文本进行逐句分类和信息精简;S4:基于指针‑生成器网络架构,构建并训练结合文本序列和标签特征的端到端Seq2Seq文本生成模型作为第二模型;S5:基于第一模型和第二模型,对输入文本进行端到端的庭审质询性问题自动生成。本发明可基于不同案件的起诉与答辩文本乃至部分庭审对话记录,结合由专家提供的类案判案逻辑,生成可供参考的庭审法官质询性问题,从而辅助法官判案。
-
公开(公告)号:CN112101516B
公开(公告)日:2024-11-26
申请号:CN202010750071.9
申请日:2020-07-30
IPC: G06F18/25 , G06F18/2433 , G06F18/214 , G06F18/21 , G06N3/0475 , G06N3/045 , G06N3/094 , G06N3/084
Abstract: 本发明提出了一种目标变量预测模型的生成方法、系统及装置,通过获取原始数据集;将原始数据集中含有的自变量数据和所述自变量数据随机生成的自变量随机矩阵输入至预设对抗网络模型,利用所述预设对抗网络模型,得到权重向量;利用所述原始数据集和利用权重向量对待训练的预设神经网络模型进行训练和模型参数调整,直至得到训练完成的目标变量预测模型。本发明实施例利用预设对抗网络模型根据原始数据集生成权重向量,并使用权重向量对预设网络模型的损失函数进行训练得到目标变量预测模型,而目标变量预测模型即使在训练数据集的数据分布发生了非常大变化的情况下,依然可以保持较好的预测能力。
-
公开(公告)号:CN118609803A
公开(公告)日:2024-09-06
申请号:CN202410225816.8
申请日:2024-02-29
Applicant: 浙江大学
Abstract: 本发明公开了一种帕累托最优的因果效应估计和策略学习的预测方法,包括以下步骤:将待预测病人的特征数据以及药物干预剂量数据输入到经过训练的帕累托最优因果效应估计模块中,对应得到短期、长期康复率结果。将待预测病人的特征数据输入到经过训练的帕累托最优策略学习模块中,得到最佳药物治疗剂量。相较于以前的方法,本发明提出了一个新颖的端到端算法,同时解决了因果效应预测以及策略学习这两个任务中长短期结果之间的冲突问题。本发明可以确定干预变量的最佳取值,使得该干预变量导致的短期效应和长期效应具有帕累托最优性。
-
公开(公告)号:CN118411544A
公开(公告)日:2024-07-30
申请号:CN202410096265.X
申请日:2024-01-23
Applicant: 浙江大学
IPC: G06V10/764 , G06V10/82 , G06V10/774 , G06N3/0455 , G06N3/0475 , G06N3/0895
Abstract: 本发明公开了一种基于生成模型的无偏图像分类方法,减轻图像各个属性之间的虚假关联,得到更公平的图像分类器。包括如下步骤:1)利用微调后的图像生成模型和分类标签,得到不同偏见程度的编辑方向;2)将不同编辑方向向量合成,得到只对偏见属性进行编辑的编辑方向;3)利用此编辑方向,对原始训练集图像进行不同程度的编辑,利用对比学习得到无偏见编码器;4)利用无偏见编码器对训练集进行编码,再用无偏编码训练得到无偏分类器。本发明相较于其他无偏图像分类方法,无需得知偏见属性,可同时消除多个偏见属性的影响;同时适用于二分类任务及多分类任务;在多个指标上提升了图像分类器的公平性。
-
公开(公告)号:CN118298279A
公开(公告)日:2024-07-05
申请号:CN202410468579.8
申请日:2024-04-18
Applicant: 上海浙江大学高等研究院
IPC: G06V10/82 , G06N3/096 , G06N3/0464
Abstract: 本发明公开了一种跨领域无源域数据的知识蒸馏方法、系统、介质及设备,包括:利用经过预训练教师模型先训练图像生成器再训练图像编码器同时预热学生模型,并利用各自的损失函数单独进行参数更新;利用图像生成器、图像编码器以及教师模型在学生域训练数据集上训练遮罩网络,再在学生域训练数据集上训练学生模型,通过阶段因子调节域特定信息损失和跨域知识蒸馏损失的权重;将待预测图像输入到训练好的学生模型中,得到待预测图像的分类标签。本发明通过无数据知识蒸馏网络、遮罩学习网络、课程学习网络,解决了在仅有目标域(学生域)数据而缺少源域(教师域)数据且源域和目标域存在较大偏移情况下,迁移教师模型知识的问题。
-
公开(公告)号:CN118196472A
公开(公告)日:2024-06-14
申请号:CN202410125075.6
申请日:2024-01-29
Applicant: 浙江大学
IPC: G06V10/764 , G06V10/774 , G06V10/44 , G06V10/82 , G06N3/0455 , G06N3/088
Abstract: 本发明公开了一种基于条件域提示学习提高复杂多样数据分布的识别方法,包括:获取真实环境图像、图像的类别标签以及图像的领域标签。使用图像的类别标签和领域标签构建新的文本提示词,并将其输入到文本编码器以提取文本特征,将图像输入到图像编码器以提取图像特征。此外,为了捕获实例特定和领域特定信息,提出轻量级域元网络,用于为每个领域图像生成输入条件标记。使用提取到的图像特征和文本特征计算交叉熵损失,并优化提示分类模型。将待分类图像输入到经过训练的提示分类模型中,通过最大化先验概率输出待分类图像的预测类别。相较于最近的预训练视觉‑语言模型方面取得的进展,本发明的方法展现了在学习分布外表示方面的巨大潜力。
-
公开(公告)号:CN117994570A
公开(公告)日:2024-05-07
申请号:CN202410018143.9
申请日:2024-01-05
Applicant: 浙江大学
IPC: G06V10/764 , G06V10/774 , G06V10/44 , G06V10/82 , G06N3/0464 , G06N3/08
Abstract: 本发明公开了一种基于模型无关适配器提高复杂多样数据分布的识别方法,包括如下步骤:利用不同种环境下用于数据分布识别的训练集训练数据分布识别模型,基于最小化独立同分布损失函数以及分布外泛化损失函数对数据分布识别模型的网络参数进行更新;最后将若干个待分类识别的图像数据输入到经过训练的数据分布识别模型中,每个待分类识别的图像数据服从独立同分布或者分布外泛化,输出每个待分类识别的图像数据的预测类别,完成基于模型无关适配器的数据分布识别。本发明着重于从网络模型架构出发,解决了现有的大多数方法需要预先使用先验知识知道测试图像数据分布难题,提升真实环境数据识别性能及相关应用的精度。
-
-
-
-
-
-
-
-
-