-
公开(公告)号:CN118013940A
公开(公告)日:2024-05-10
申请号:CN202311537725.X
申请日:2023-11-17
Applicant: 中国科学院信息工程研究所
IPC: G06F40/166 , G06F40/216 , G06F40/289 , G06F40/247 , G06F16/33
Abstract: 本发明公开了一种预训练掩码语言模型全流程自动纠偏方法、装置及介质,属于人工智能下的自然语言处理分支领域。本发明从公共知识库中获取每个主题的短语,基于预训练掩码语言模型MLM筛选出与每个主题的种子短语最相似的多个短语,构成主题短语集合;基于包含多个掩码标记的提示和MLM,计算多token粒度的刻板印象短语的概率分布,并根据概率分布差异计算针对每个输入提示的损失,并获取最大化损失的有偏见的提示;通过最小化针对每个输入提示的损失,对MLM进行微调;利用微调后的MLM对输入的自然语言进行自动纠偏。本发明通过自动化的方式来一定程度减轻大型预训练掩码语言模型的偏见问题,降低人工纠正偏见的数据成本。