-
公开(公告)号:CN119046538A
公开(公告)日:2024-11-29
申请号:CN202411120312.6
申请日:2024-08-15
Applicant: 上海浙江大学高等研究院 , 浙江大学
IPC: G06F16/9536 , G06F16/9535 , G06N3/08 , G06Q30/0601 , G06N3/0985
Abstract: 本发明公开了一种协同大模型和推荐小模型计算的方法及系统。本发明的方法通过设计端云协同的推荐模型框架,由基于云的大型模型利用历史数据生成候选列表和初始排名,在端侧设备上的小型模型使用最新的用户数据动态重新排列此列表。协同决策请求通过评估大型模型的初始排名和小型模型的后续重新排名之间的一致性来评估调用大型模型的需要。将大语言模型的特征提取能力与小型推荐模型的便利性结合起来,增强了大语言模型在设备上的实用性和准确性。
-
公开(公告)号:CN118446308A
公开(公告)日:2024-08-06
申请号:CN202410421823.5
申请日:2024-04-09
Applicant: 上海浙江大学高等研究院
Abstract: 本发明公开了一种面向选择偏差的影子变量表征生成与因果推断方法及系统,包括如下步骤:影子变量表征生成,将观察到的协变量映射到表征空间,并施加影子变量所需要的约束,同时对生成的影子变量表征进行假设检验,最终生成符合影子变量假设的表征;将生成的通过了假设检验的影子变量表征嵌入影子变量回归方法准确预测因果效应。本发明使用两阶段的方法,第一阶段在表征生成过程中施加影子变量约束,第二阶段对生成的影子变量表征进行检验,以迭代的方式自动学习得到影子变量表征。相较于传统的影子变量回归方法,本发明放宽了对专家知识进行影子变量挑选的依赖;对于影子变量挑选方法来说,本发明也不再依赖观测数据中必须存在影子变量。
-
公开(公告)号:CN118298279A
公开(公告)日:2024-07-05
申请号:CN202410468579.8
申请日:2024-04-18
Applicant: 上海浙江大学高等研究院
IPC: G06V10/82 , G06N3/096 , G06N3/0464
Abstract: 本发明公开了一种跨领域无源域数据的知识蒸馏方法、系统、介质及设备,包括:利用经过预训练教师模型先训练图像生成器再训练图像编码器同时预热学生模型,并利用各自的损失函数单独进行参数更新;利用图像生成器、图像编码器以及教师模型在学生域训练数据集上训练遮罩网络,再在学生域训练数据集上训练学生模型,通过阶段因子调节域特定信息损失和跨域知识蒸馏损失的权重;将待预测图像输入到训练好的学生模型中,得到待预测图像的分类标签。本发明通过无数据知识蒸馏网络、遮罩学习网络、课程学习网络,解决了在仅有目标域(学生域)数据而缺少源域(教师域)数据且源域和目标域存在较大偏移情况下,迁移教师模型知识的问题。
-
公开(公告)号:CN115188484A
公开(公告)日:2022-10-14
申请号:CN202210836782.7
申请日:2022-07-15
Applicant: 上海浙江大学高等研究院 , 上海人工智能创新中心
Abstract: 本发明公开了一种基于潜在群组工具变量的多方混合数据溯源方法及系统。该方法通过表征学习,将病况信息映射到一个表征空间;再通过期望最大化算法,基于给定的类簇数量,利用期望最大化算法识别异质治疗方案分配机制,即干预变量和混淆变量在不同数据来源上有不同的因果关系;最后基于异质治疗方案分配机制,将病历数据划分为多个不同的样本子群,并且基于相关性指标为数据选择最佳群组工具变量作为多方数据的不同来源指示变量,以此溯源得到不同医疗机构诊疗手段的差异,实现病历样本的分组。本发明可进一步基于来源指示变量,将潜在群组工具变量嵌入工具变量回归方法结合多方知识进行联合学习,为每一位病人提供辅助的精准治疗方案推荐。
-
公开(公告)号:CN118485053A
公开(公告)日:2024-08-13
申请号:CN202410611373.6
申请日:2024-05-16
Applicant: 上海浙江大学高等研究院
IPC: G06F40/186 , G06F16/35 , G06N3/0442 , G06N3/08 , G06Q50/18 , G06N3/0455 , G06N3/0464 , G06F40/205
Abstract: 本发明公开了一种基于模板和判决信息的法院观点生成方法、系统及设备,旨在生成更高质量的司法观点。该方法分为两步:(1)首先确定司法观点中的判决信息,并构建基于拓扑结构的信息流,将判决信息的预测作为多个分类子任务和生成子任务的集合,通过信息融合编码器、多角度拓扑结构解码器预测出判决信息预测出判决信息。(2)然后构建法院观点生成器,生成遮盖判决信息的法律文书模板,最后将预测的判决信息填入相应的遮盖位置,构成法院观点。通过在起诉书和非起诉书的数据集上进行了大量实验,对比其他模型并进行消融实验,证明了本方法的有效性。
-
公开(公告)号:CN118313509A
公开(公告)日:2024-07-09
申请号:CN202410421820.1
申请日:2024-04-09
Applicant: 上海浙江大学高等研究院
IPC: G06Q10/04 , G06F18/24 , G06F18/214 , G06Q50/00 , G06N3/042 , G06N3/0464 , G06N3/0475 , G06N3/09
Abstract: 本发明公开了一种社交网络标签预测方法、系统、介质及设备,包括如下步骤:1)将输入的社交网络数据构建为社交网络图;2)表征学习,使用图神经网络(如图卷积神经网络)对社交网络图信息进行特征提取得到表征;3)在学习到的表征空间中加入随机的扰动或者是基于生成器网络生成的对抗扰动得到新的表征,然后将新的表征输入到图神经网络的下一层进行图特征信息的提取;4)在加入扰动后的表征的图上和图中已有的社交信息标签监督下进行一轮参数优化;5)重复迭代,完成图神经网络的训练并用于预测。本发明对训练集的社交网络数据具有较强的鲁棒性和准确率,可以有效的帮助图神经网络抵抗图结构的扰动和对抗攻击,从而更准确预测用户标签。
-
-
-
-
-