-
公开(公告)号:CN119886308A
公开(公告)日:2025-04-25
申请号:CN202510360851.5
申请日:2025-03-26
Applicant: 中国科学技术大学
Abstract: 本发明公开了一种面向大模型的知识消除学习的参数调整方法及系统,所述面向大模型的知识消除学习的参数调整方法包括:获取大语言模型初始参数以及消除请求;利用影响函数计算消除请求对应的目标数据对于模型参数的影响,得到参数变化量;根据参数变化量,对适配器模块的参数进行更新。本方法通过引入影响函数,精准估计数据扰动对模型参数的影响,从而避免了传统方法需要完全重新训练模型的高昂计算开销,显著提升了计算效率。通过高效的参数调整机制,在无需重新训练模型的情况下,实现了对多种实例级忘记任务的精准处理。这不仅提高了模型的鲁棒性和准确性,还展现了其在大规模工业场景中的实际应用潜力。
-
公开(公告)号:CN119886073A
公开(公告)日:2025-04-25
申请号:CN202510386461.5
申请日:2025-03-31
Applicant: 中国科学技术大学
IPC: G06F40/166 , G06F16/35 , G06F18/23213 , G06N3/045 , G06F40/194
Abstract: 本发明公开了一种大语言模型知识编辑方法及系统,所述大语言模型知识编辑方法包括:对模型神经元的重要性进行评分,得到每个神经元的评分值;基于评分计算贡献值,并根据预设定的贡献阈值选择参与知识编辑的关键神经元集;将距离聚类中心最近的样本作为锚点样本,所有聚类内的实例共享一个基于锚点样本的更新向量进行第一阶段更新,对每个实例进行额外的个性化调整以进行第二阶段更新。本方法通过引入基于解释性的关键神经元识别,实现了对目标知识的精准定位,从而在大语言模型中进行知识编辑时提供了更高的准确性和效率。通过知识聚类和两阶段梯度更新的结合,有效降低了编辑过程中的计算开销,同时确保模型的稳定性和鲁棒性。
-
公开(公告)号:CN119398179B
公开(公告)日:2025-04-11
申请号:CN202510000941.3
申请日:2025-01-02
Applicant: 中国科学技术大学
IPC: G06N5/04 , G06N3/0455 , G06N3/0895 , G16C20/50 , G16C20/70 , G16C10/00
Abstract: 本发明公开了基于混合专家模型与大语言模型的三维分子文本理解方法,所述三维分子文本理解方法包括:构建混合专家模型的新MoE层,所述MoE层包括多个专家,通过跨模态投影器对任务信息文本及文本上下文进行编码并输入至混合专家模型的路由中;训练处理不同任务的分子编码器,将训练后的分子编码器整合至统一的3D分子编码器中。本发明通过引入文本辅助的MoE层,将任务信息注入路由输入,增强了模型处理特定任务的能力,且提供一种能够同时理解2D、3D分子以及各种不同分子性质的通用模型。通过结合多种分子编码器,提高了对分子特性的全面理解。通过设计分子‑文本映射器,促进了分子特征与文本之间的深度融合,提升了模型对三维分子文本理解能力。
-
公开(公告)号:CN118569348B
公开(公告)日:2024-11-08
申请号:CN202410919603.5
申请日:2024-07-10
Applicant: 中国科学技术大学
IPC: G06N3/09 , G06N3/0985 , G06N3/045 , G06N5/04
Abstract: 本发明公开了一种基于直接偏好优化的模型偏好对齐方法及装置,所述基于直接偏好优化的模型偏好对齐方法包括:获取数据,数据包括偏好数据集,利用偏好数据集的有监督微调初始化模型,并获取模型收敛状态;根据模型收敛状态从偏好数据集中采样一个批量并计算个体奖励差异;根据个体奖励差异从所述偏好数据集进行样本采样,计算批量级别的超参数;根据批量级别的超参数利用DPO损失函数计算损失并利用梯度更新算法更新模型。本发明中#imgabs0#通过动态校准#imgabs1#值,并结合数据质量考虑,优化了DPO的性能。此外,#imgabs2#还引入了#imgabs3#引导的数据过滤方法,以减少异常值对模型训练的影响,#imgabs4#在多种模型和数据集上显著提高了DPO的性能。
-
公开(公告)号:CN118761476A
公开(公告)日:2024-10-11
申请号:CN202411009888.5
申请日:2024-07-26
Applicant: 中国科学技术大学
Abstract: 本发明公开了一种多模态大语言模型神经元归因方法及相关设备,所述方法包括:利用MLLMs模型生成的具有特定语义的图像,获取图像中与特定语义相关的特定区域;评估MLLMs模型图像生成模块输入的每个维度与生成图像中特定区域的相关性;获取神经元对最后表示的贡献,并整合每个维度的贡献分数,将贡献分数最高的神经元作为I‑神经元;获取神经元对文本输出归因评分,将归因评分最高的神经元作为T‑神经元。本发明不依赖于梯度计算和因果效应等耗时且对存储要求极高的技术,同时可以排除生成图像中自带的语义噪声信息干扰,针对特定语义概念,通过解耦找到对于不同输出模态的关键神经元,实现高效、准确的神经元归因。
-
公开(公告)号:CN114821119B
公开(公告)日:2022-10-28
申请号:CN202210714507.8
申请日:2022-06-22
Applicant: 中国科学技术大学
IPC: G06V10/46 , G06V10/40 , G06V10/774 , G06V10/776 , G06V10/82 , G06K9/62 , G06N3/04
Abstract: 本发明公开了一种针对图数据不变特征的图神经网络模型的训练方法和装置。该方法包括:利用诠释生成器对原图进行特征提取,得到不变本质特征子图概率分布和环境噪声子图概率分布;根据预设采样比例,得到不变本质特征强化视图和环境噪声强化视图;利用骨干图神经网络编码器处理得到第一不变本质特征图向量、第二不变本质特征图向量以及环境噪声图向量;利用多层感知机投影头得到第一不变本质特征隐空间向量、第二不变本质特征隐空间向量和环境噪声隐空间向量;利用损失值优化所述骨干图神经网络编码器;迭代进行特征提取操作、采样操作、处理操作和优化操作,直到损失值收敛于预设条件,得到训练完成的骨干图神经网络编码器。
-
-
公开(公告)号:CN109270605B
公开(公告)日:2020-02-07
申请号:CN201811396463.9
申请日:2018-11-22
Applicant: 中国科学技术大学
Abstract: 本发明提出一种非球面微小透镜及其阵列的制作方法和装置,利用设置在台架(8)的一个开口向上的桶(1)和活塞(2)以及桶底部设置的具有不同分布的微小圆孔的可换的平面基底片(4),将不同体积的光刻胶(3)液滴挤出垂悬在平面基底片(4)的下平面的具有亲水性能的基底平面(5)上,液滴在基底平面(5)上铺展的同时,利用体积力的向下拉伸作用,来获得稳态的、非球面系数K
-
公开(公告)号:CN101344723B
公开(公告)日:2011-05-11
申请号:CN200810022549.5
申请日:2008-08-15
Applicant: 中国科学技术大学
Abstract: 本发明提供一种微细光固化厚膜逐层自动成型方法及装置,属于微细光(快速)成型加工领域。该装置包括两个便于计算机集成控制的精密直线运动平台和整体式双开口树脂槽及成型槽以及刮刀及其位置控制器。垂直精密直线运动平台的滑块通过连杆与上挤压滑塞和滑动载物台固定连接,水平精密直线运动平台的滑块横梁上安装一个高线性度刮刀;整体式双开口树脂槽及成型槽为一个具有2个开口的内部连通液态树脂槽和一个相对独立的圆形开口成型槽,刮刀是一个具有疏水性好,高线性度的直线形刀口,其左右两端位置控制器设置在集成箱式平台,所有部件安装在一基础平台上,其所有驱动和控制线路均连接至一个计算机控制的控制箱中。本发明具有结构紧凑,能获得高精度、厚度均匀的液态树脂厚膜,基于计算机控制技术实现液态树脂的逐层自动添加和成型,并与“微细光成型”系统软件实现链接,具有高度的自动化、集成化,可操作性好。
-
公开(公告)号:CN119004337A
公开(公告)日:2024-11-22
申请号:CN202411433395.4
申请日:2024-10-15
Applicant: 中国科学技术大学
IPC: G06F18/2433 , G06F18/213 , G06N3/0455 , G06N3/042 , G06N3/0464 , G06N3/08
Abstract: 本发明公开了一种基于扩散模型的图异常检测方法及装置,所述图异常检测方法包括:获取图数据,使用预训练的自动编码器将所述图数据中的节点特征矩阵和邻接矩阵编码至隐空间中,得到隐空间嵌入;利用前向扩散过程和逆向扩散过程训练无条件扩散模型,基于所述共有特征训练条件扩散模型,通过无分类器引导所述无条件扩散模型和所述条件扩散模型构造判别性特征,并将判别性特征集成至隐空间中,获得具有判别性特征的隐空间嵌入;基于具有判别性特征的隐空间嵌入,分别重建图数据中的节点特征矩阵和邻接矩阵,并计算重建误差,将重建误差高的实体识别为异常。本发明能够应用到各种现实场景中,简单高效,在多个数据集上的图异常检测性能有显著提升。
-
-
-
-
-
-
-
-
-