基于双重掩码散度的多模态大语言模型知识遗忘方法

    公开(公告)号:CN118761438A

    公开(公告)日:2024-10-11

    申请号:CN202410626273.0

    申请日:2024-05-20

    Applicant: 东南大学

    Abstract: 本发明涉及一种基于双重掩码散度的多模态大语言模型知识遗忘方法,该方法首先确定目标遗忘概念,然后通过引入双重掩码KL散度损失来细化训练损失,从而在不损害模型整体性能的情况下,有效地移除特定概念的记忆。双重掩码包括句子级掩码和令牌级掩码,分别在句子和令牌级别排除或调整相关标记的处理,以减少目标概念在模型输出中的概率。此外,本发明还涉及一个综合基准测试,用于评估多模态大语言模型中的知识遗忘效果,评估指标包括功效、通用性、特异性、流畅性和运行成本。此方法特别适用于处理个人隐私信息或受版权保护的内容的遗忘,为多模态场景中的知识遗忘提供了一个高效和可靠的技术方案。

Patent Agency Ranking